Informations

Qu'est-ce que nous utilisons comme référence pour déterminer quels segments génétiques sont des « mutations » (et lesquels ne le sont pas)


Afin de déterminer si un segment particulier du génome est une mutation, il doit d'abord exister un code de base sur lequel ce code semble quelque peu différent.

Comment le génome de base a-t-il été déterminé? Quelqu'un a-t-il déterré un squelette humain _très_ancien_ qui a ensuite été analysé par ADN pour être utilisé comme base de référence ?

Ou est-ce que les mutations contiennent une sorte d'empreinte digitale qui indique aux chercheurs que « ce n'est pas le génome d'origine » ? Si oui, à quoi ressemble cette empreinte digitale ?


Il peut être utile de réfléchir à la généalogie des séquences en question. En général, nous supposons que toutes les séquences d'ADN d'organismes sont liées par un ensemble de processus. Un processus particulièrement important concernant les séquences d'ADN est réplication. Cela établit une relation parent-enfant entre les séquences d'ADN dans un cycle de réplication ou une relation ancêtre-descendant lorsque nous affichons plus d'un cycle de réplication.

Pour plus de simplicité, considérons une seule cellule bactérienne, qui réplique son génome et se divise, produisant une cellule descendante. Ce processus se poursuit pour chaque cellule et produit une population de cellules au fil du temps. Cette population de cellules (et leurs génomes) sont liées les unes aux autres par ce processus de réplication et de division. La structure de cette relation est un arbre (au sens mathématique). Les sommets de l'arbre sont les séquences d'ADN (ou cellules) et une arête dirigée desommet jeàsommet jexiste si et seulement si la séquence représentée parsommet jest le résultat d'une réplication de la séquence représentée parsommet je.

En plus du processus de réplication qui fait que cette structure arborescente relie les séquences, il existe des processus mutationnels qui conduisent à des différences de séquence.

Il existe de nombreuses façons pour les mutations d'apparaître avant ou pendant la réplication de l'ADN. La chose importante à noter est que ces mutations sont transmises aux descendants. Ainsi, une cellule est soit génétiquement identique à sa cellule mère, soit elle contient un certain nombre de mutations (insertions, délétions ou polymorphismes dans l'ADN) par rapport à son parent.

Ces mutations (différences de séquence) sont héritées lors de la réplication, et vous pouvez les considérer comme "se produisant" le long d'un bord donné de l'arbre d'une cellule parent à une cellule enfant.

Maintenant, si vous considérez deux séquences d'ADN, ainsi que le modèle qui vient d'être donné, ces deux séquences sont liées par le processus de réplication-mutation (l'arbre). Si les séquences d'ADN ne sont pas identiques, vous avez plusieurs façons d'interpréter cette question de ce qu'est une mutation. Il est utile de considérer l'ancêtre commun le plus récent des deux séquences d'ADN pour donner un sens aux différences observées dans l'ADN. Si vous considérez la généalogie comme un arbre et que vous considérez deux sommets dans l'arbre, puis que vous remontez vers la racine de l'arbre à partir de chaque sommet, ces traces finiront par se rencontrer à un autre sommet. Le premier sommet auquel ils se rencontrent est l'ancêtre commun le plus récent.

Il est possible que des mutations se soient produites le long des deux chemins depuis l'ancêtre commun (le plus récent) jusqu'aux séquences descendantes que vous étudiez. Si vous étudiez N séquences, il existe N chemins à partir de l'ancêtre commun sur lesquels des mutations peuvent s'être produites.

Tout cela pour dire que des mutations se produisent par rapport à ce processus généalogique. Si vous considérez simplement 2, ou N, séquences sans tenir compte du processus qui les a générées, alors il peut être dénué de sens ou déroutant de considérer une différence de séquence particulière comme un mutation par rapport à une autre séquence considérée. Par exemple, si vous observez un seul polymorphisme nucléotidique entre deux séquences, comment sauriez-vous quelle séquence est le résultat de la mutation ? Il est possible qu'une ou les deux séquences portent un événement de mutation dans son histoire généalogique puisque l'ancêtre commun des deux séquences.