Tout d'abord, commençons par les bases. Tous les êtres vivants ont un génome.
Les génomes sont constitués d'ADN. Chacune de vos cellules contient une copie de votre génome. On peut le comparer à un manuel d'instructions ou à un livre de recettes. Le génome contient toutes les instructions ou les "recettes" dont votre corps a besoin pour fonctionner et avoir l'apparence qu'il a.
Le génome humain est écrit dans une série de 3 milliards de bases d'ADN de quatre types différents. Chaque base peut être représentée par l'une des quatre "lettres" de l'"alphabet" de l'ADN. La majeure partie de votre ADN ressemble à celui de n'importe quelle autre personne. Mais d'infimes différences dans l'orthographe ou la séquence de ces lettres dans des milliers de gènes de votre génome expliquent, en partie, ce qui vous rend unique.
Les virus ont eux aussi un génome. Le génome d'un virus peut être constitué d'ADN ou d'une molécule similaire appelée ARN. Comparé à votre génome, celui d'un virus est minuscule. Par exemple, les coronavirus, comme celui qui est à l'origine du COVID-19, ont un génome ARN d'environ 30 000 lettres (soit 100 000 fois plus petit que le génome humain). Le génome de l'influenza ou virus de la grippe est encore plus court, avec environ 13 500 lettres d'ARN.
Tous les virus ne rendent pas les gens malades. Mais les génomes de ceux qui le font contiennent toutes les instructions nécessaires pour qu'ils puissent infecter nos cellules, faire d'autres copies d'eux-mêmes et se propager. De petites différences dans ces instructions peuvent donner à différents virus ou à différentes variantes ou souches d'un même virus un aspect différent et un comportement différent. Les scientifiques peuvent en apprendre beaucoup sur un virus en étudiant son génome.
La séquence du génome d'un virus est la séquence ou l'ordre des bases ou des lettres qui constituent le matériel génétique d'un virus, ou son génome. Si vous deviez écrire
la séquence du génome d'un coronavirus particulier, il s'agirait d'une série d'environ 30 000 lettres. La clé est de les obtenir dans l'ordre exact où vous les trouvez dans un virus particulier.
Dans le cas de l'ARN, les scientifiques utilisent les lettres A, C, G et U, qui représentent chacune des quatre bases de l'ARN : adénine, cytosine, guanine et uracile. C'est la même chose pour l'ADN, sauf que c'est un T pour thymine à la place de l'uracile. Le processus que les scientifiques utilisent pour déterminer le bon ordre des lettres dans un certain échantillon de virus s'appelle le séquençage du génome.
Que nous apprend le séquençage du génome d'un virus ?
Les virus et les génomes des virus changent tout le temps. La raison en est que les cellules font parfois des erreurs.
Lorsqu'un génome viral est copié à l'intérieur d'une cellule infectée, il arrive qu'une "coquille" passe au travers. La plupart du temps, ces fautes d'orthographe ne font pas une grande différence. Mais parfois, elles peuvent modifier l'aspect ou le comportement d'un virus d'une manière qui s'avère importante. Personne ne sait exactement d'où vient le virus responsable du COVID-19. Mais il est probablement issu d'un coronavirus présent chez un autre animal, comme une chauve-souris, qui a subi par erreur une modification qui lui a permis d'infecter l'homme.
C'est grâce au séquençage du génome que les scientifiques ont découvert ce nouveau coronavirus humain peu après son apparition chez l'homme. Au départ, ils savaient que des personnes en Chine tombaient soudainement malades avec des symptômes respiratoires. Les scientifiques ont donc séquencé le génome d'un échantillon viral provenant d'une personne qui travaillait sur un marché d'où ils pensaient qu'il pouvait provenir. En comparant la séquence d'ARN à d'autres séquences génomiques virales obtenues lors d'études antérieures, ils ont tout de suite compris qu'il s'agissait d'un coronavirus qu'ils n'avaient jamais vu chez l'homme auparavant.
Même s'il s'agissait d'un nouveau virus, les chercheurs ont tout de suite su beaucoup de choses sur lui grâce à son génome. En effet, les scientifiques avaient étudié des coronavirus apparentés qui avaient déjà provoqué des épidémies chez l'homme. Grâce à ces études, ils connaissaient certaines des parties importantes du génome du coronavirus, notamment le gène qui code pour ce que les scientifiques appellent la protéine spike.
Ils savaient que la protéine spike serait importante pour que le virus puisse infecter nos cellules. Ils savaient également qu'elle pourrait constituer une cible utile pour les vaccins ou d'autres traitements. Ils ont su tout cela peu après avoir découvert le coronavirus, car ils ont pu séquencer son génome et le comparer à d'autres génomes viraux.
Le séquençage du génome peut donc révéler de nombreuses choses utiles.
Il peut identifier un nouveau virus ou vous dire quel type de virus rend quelqu'un malade. Il peut donner aux scientifiques des idées sur la façon dont un virus peut nous rendre malades sur la base de ses gènes et des protéines qu'ils codent, ainsi que des moyens d'essayer de l'arrêter. Lorsqu'un virus se propage d'une personne à l'autre dans le monde, les scientifiques peuvent utiliser les séquences génomiques pour suivre ses mouvements et les changements qui se produisent.
À quoi sert le séquençage du génome du virus COVID-19 et de la grippe ?
Les scientifiques suivent les virus de la grippe depuis des décennies. Ils les utilisent pour comparer les virus présents aujourd'hui à ceux qui existaient dans le passé. Sur la base des séquences du génome, ils recherchent des différences importantes dans la façon dont certains gènes sont orthographiés. Certains changements ne font pas grande différence. Mais d'autres influent sur la facilité avec laquelle un virus se propage d'une personne à l'autre ou sur le degré de maladie qu'il provoque.
Chaque année, les scientifiques utilisent les séquences du génome de la grippe pour les aider à décider ce qu'il faut inclure dans les vaccins contre la grippe. Comme ces virus existent depuis très longtemps et qu'ils évoluent sans cesse, il est possible de trouver des versions légèrement différentes, même dans des échantillons provenant d'une seule personne atteinte de la grippe. Au cours d'une année normale, les scientifiques séquencent des milliers de virus de la grippe pour les tenir informés et les aider à prendre des décisions en matière de santé publique.
Dans la pandémie de COVID-19, le séquençage du génome a été important. Les séquences génomiques aident les scientifiques à suivre la façon dont le coronavirus se propage et comment il évolue. Ils peuvent également étudier les séquences génomiques pour déterminer les changements dont il faut s'inquiéter et ceux qui ne le sont probablement pas.
Par exemple, une étude menée à Boston a utilisé environ 800 génomes viraux pour voir comment le coronavirus s'y est propagé très tôt. En se basant sur de minuscules changements dans les génomes, les chercheurs ont pu constater que le coronavirus avait atteint la région de Boston des dizaines de fois, en provenance d'Europe et de certaines régions des États-Unis.
Les scientifiques continuent de séquencer le coronavirus à l'origine du COVID-19 pour comprendre son évolution et repérer les nouvelles variantes dès leur apparition. Ce processus est appelé surveillance génomique.
La surveillance génomique implique le séquençage de nombreux échantillons. Elle permet de découvrir de nouveaux variants, c'est-à-dire des génomes viraux comportant une ou plusieurs mutations.
Certains variants qui apparaissent disparaissent simplement ou ne font aucune différence. Lorsque des changements dans le génome semblent être inquiétants, les scientifiques les classent en tant que "variants d'intérêt" ou "variants préoccupants". Vous connaissez probablement les variantes de coronavirus telles que Delta ou Omicron.
L'une des raisons pour lesquelles les scientifiques se sont inquiétés très tôt d'Omicron est que ce variant présente une cinquantaine de fautes de frappe ou de mutations dans son génome. Un grand nombre de ces mutations se trouvent également dans la protéine spike, qui est la partie du virus que les vaccins et notre système immunitaire utilisent pour l'attaquer.
En raison de ces modifications, Omicron se propage plus rapidement que le coronavirus original à l'origine du COVID-19. Les scientifiques s'attendent à ce que de nouvelles variantes continuent de voir le jour. En poursuivant le séquençage du génome et la surveillance, ils peuvent essayer de garder une longueur d'avance sur le virus. Les scientifiques peuvent utiliser le séquençage du génome pour identifier et suivre tout virus qui les intéresse.
Comment se fait le séquençage du génome d'un virus ?
Le séquençage du génome est beaucoup plus facile et moins cher aujourd'hui qu'auparavant. Les génomes viraux sont également plus faciles à séquencer qu'un génome humain en raison de leur petite taille. Voici les principales étapes :
Extraction
. Les scientifiques extraient l'ARN ou l'ADN d'un échantillon qui contient un virus.
Préparation de l'échantillon
. Les scientifiques préparent l'échantillon. Par exemple, ils peuvent être amenés à hacher l'ARN ou l'ADN en plus petits morceaux ou à ajouter certains fragments aux extrémités. Les étapes spécifiques dépendent du type de machine que les scientifiques utilisent.
Séquençage
. Les scientifiques mettent l'échantillon dans une machine de séquençage. La machine lit des signaux qui leur indiquent l'ordre des bases ou des lettres dans l'ADN ou l'ARN.
Analyse
. Les machines vont se retrouver avec beaucoup de chaînes de lettres qui ne couvrent pas individuellement l'ensemble du génome. Elles utiliseront des ordinateurs pour assembler le tout en une séquence complète du génome et identifier les différences de la nouvelle séquence par rapport aux autres.