Informations

Comment la recombinaison homologue et les mutations affecteraient-elles la spéciation ?

Comment la recombinaison homologue et les mutations affecteraient-elles la spéciation ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je me demande comment la recombinaison homologue et les mutations peuvent affecter la façon dont la spéciation peut se produire à partir d'une espèce (de sorte que 2 seront créés).

Je fais des recherches et j'ai découvert que différentes mutations et combinaisons génétiques se produisent dans deux populations géographiquement séparées, ce qui peut conduire à la spéciation.

Je sais que la recombinaison peut entraîner différentes combinaisons génétiques, mais comment cela se produit-il dans un arbre phylogénétique ? Techniquement, la recombinaison ne jouerait-elle aucun rôle dans la conduite de l'évolution ?

Ma (en quelque sorte) supposition est que disons que la recombinaison crée une population avec beaucoup de gènes AA et que l'autre population, disons par hasard (dérive génétique), a une population avec beaucoup de gènes aa.

Nous savons que A et a diffèrent peut-être de quelques SNP, donc en moyenne, les deux populations deviendraient légèrement différentes l'une de l'autre en raison de la dérive génétique et de la séparation géographique.

Ai-je la bonne idée ici? Je ne sais pas à 100% comment la recombinaison pendant la prophase I affecterait la recombinaison. En espérant que quelqu'un puisse me clarifier cela ou m'apporter de nouvelles idées.

Merci!


La recombinaison se produit lorsque des séquences d'ADN homologues s'apparient et se croisent, échangeant essentiellement du matériel génétique. Maintenant, disons que cette jonction croisée est au milieu d'un gène, et nous avons des différences génétiques dans la moitié supérieure et certaines dans la partie inférieure qui distinguent les deux allèles. Si la recombinaison se produit au milieu du gène, alors une nouvelle combinaison d'allèles est créée qui n'existait pas auparavant. Cette nouvelle version du chromosome peut désormais être transmise en une seule unité via la reproduction sexuée.

J'ai omis beaucoup de détails évidemment, mais c'est l'idée de base. La raison pour laquelle la recombinaison ajoute à la diversité génétique et peut conduire à la spéciation est qu'elle consiste essentiellement à mélanger et à faire correspondre des combinaisons existantes pour créer de nouveaux allèles.


Réparation de rupture de double brin

C. Gelot, . B.S. Lopez , dans Stabilité du génome , 2016

Résumé

La recombinaison homologue (HR) est un processus évolutif fondamental qui est essentiel pour la plasticité du génome. Les RH participent au maintien de la stabilité du génome tout en facilitant la diversité génétique.

Ce chapitre résume les différents mécanismes moléculaires de la RH chez les mammifères. Les rôles des RH dans la réparation des cassures double brin (DSB) de l'ADN, la réactivation des fourches de réplication arrêtées et leurs conséquences (sensibilité aux radiations, méiose et application à la manipulation du génome) sont discutés. Les RH sont en concurrence avec d'autres voies pour la réparation des DSB. Ainsi, un modèle est proposé pour le choix de la voie de réparation DSB en deux étapes : (1) résection d'ADN simple brin versus jonction d'extrémité non homologue canonique et (2) jonction d'extrémité alternative versus HR sur ADN réséqué.

La RH est une arme à double tranchant qui favorise le maintien de la stabilité du génome mais peut générer une instabilité du génome. Des situations d'instabilité génétique induite par la RH et des stratégies développées pour se protéger contre l'excès de RH sont présentées : la régulation au cours du cycle cellulaire (la RH est active en phase S/G2 lorsque les chromatides sœurs sont présentes), la détoxification des intermédiaires RH abortifs, et la répression de l'initiation RH. Ensuite, la dérégulation des RH dans les tumeurs et les stratégies anticancéreuses ciblant les RH sont discutées. Enfin, ce chapitre présente le rôle des RH dans l'évolution moléculaire des familles multigéniques dans le processus d'évolution concertée.


Liens génétiques entre recombinaison et spéciation

Droits d'auteur: © 2016 Bret A. Payseur. Il s'agit d'un article en libre accès distribué selon les termes de la licence d'attribution Creative Commons, qui permet une utilisation, une distribution et une reproduction sans restriction sur tout support, à condition que l'auteur et la source d'origine soient crédités.

Le financement: L'auteur n'a reçu aucun financement spécifique pour ce travail.

Intérêts concurrents : L'auteur a déclaré qu'il n'existe pas d'intérêts concurrents.

La méiose distingue les cellules de la lignée germinale de leurs homologues somatiques. Une partie de la méiose implique une série d'événements étranges au cours desquels les cellules endommagent délibérément leur ADN, puis le réparent. Parmi les nombreuses cassures double brin générées, une minorité est résolue sous forme d'échanges réciproques entre chromosomes homologues [1]. Dans une grande variété d'espèces, la recombinaison diversifie les génomes et est nécessaire à la formation de gamètes viables. Bien que le rôle fonctionnel du croisement doive imposer de fortes contraintes sélectives, le taux de recombinaison varie selon les individus. Le taux de recombinaison montre une ressemblance entre les parents [2], diffère entre les souches consanguines élevées dans un environnement commun [3] et répond à la sélection artificielle [4], démontrant une composante génétique aux différences de taux individuelles qui reste pour la plupart inexpliquée. Une poignée de gènes responsables de la variation du taux de recombinaison ont été identifiés, y compris des modificateurs du nombre total de croisements [5–8] et des loci qui déterminent le placement génomique des événements de recombinaison [9].

En tant qu'élément fondamental de la gamétogenèse, la méiose joue également un rôle dans la spéciation, le moyen par lequel une espèce devient deux. Une observation commune est que les hybrides autrement viables entre des lignées génétiquement différenciées souffrent d'une fertilité réduite jusqu'au point de stérilité complète - une barrière reproductive importante qui maintient les espèces distinctes [10]. Une étape au cours de laquelle des problèmes apparaissent est la méiose, lorsque la gamétogenèse hybride s'arrête parfois. Selon un modèle influent, la stérilité hybride résulte d'interactions perturbées entre différents gènes qui ont évolué dans des populations distinctes [11,12]. La recherche des gènes d'incompatibilité qui causent la stérilité hybride a jusqu'à présent donné une courte liste [13-15].

Le fait que seul un petit nombre de gènes sont connus pour contrôler la variation du taux de recombinaison ou pour contribuer à la stérilité des hybrides rend particulièrement remarquable la découverte qu'un gène médie les deux traits. Prdm9 code pour une histone méthyltransférase qui modifie la chromatine et est essentielle à la méiose chez la souris [16]. Des décennies d'efforts persistants du groupe de Jiri Forejt ont démontré que l'incompatibilité entre Prdm9 et d'autres loci provoquent la stérilité dans F1 mâles hybrides formés en croisant deux sous-espèces de souris domestiques [17]. Par la suite, la cartographie génétique des croisements, l'analyse génétique des populations, la prédiction bioinformatique des sites de liaison à l'ADN et les études d'association ont été identifiés conjointement. Prdm9 comme un déterminant principal de l'emplacement du hotspot de recombinaison (courtes séquences de séquences dans lesquelles la plupart des croisements se produisent) chez la souris et l'homme [9,18–20]. Le double rôle de Prdm9 révèlent un lien alléchant entre la recombinaison et la spéciation au niveau génétique et motivent la recherche d'autres gènes qui affectent les deux processus.

Désormais, les progrès du laboratoire de Jiri Forejt fournissent de nouvelles preuves d'un lien génétique entre la recombinaison et la stérilité hybride. Balcova et al. (2016) [21] décrivent le taux de recombinaison à l'échelle du génome en visualisant le modèle d'immunolocalisation de la protéine de réparation des mésappariements MLH1 qui résout les cassures double brin en croisements (Fig. 1). Cette approche puissante permet de compter le nombre total d'événements de recombinaison dans les spermatocytes individuels. Les auteurs utilisent d'abord la technique MLH1 pour confirmer que le génome d'une souche consanguine représentant la sous-espèce de souris domestique Mus musculus musculus connaît en moyenne 4,7 croisements de plus que le génome d'une souche consanguine descendant principalement de M. m. domestique (une augmentation de 19%). Ensuite, Balcova et al. (2016) mesurent les taux de recombinaison dans un panel de souches consanguines, dont chacune héberge des chromosomes uniques de la M. m. musculature souche sur le fond génomique de la M. m. domestique souche. En comparant les taux des souches de substitution chromosomique avec la souche parentale appropriée, les auteurs identifient trois chromosomes qui affectent le nombre de croisements à l'échelle du génome. Le locus avec le plus grand effet phénotypique est situé sur le chromosome X. Les différences de taux entre les souches de substitution portant des morceaux du chromosome localisent davantage la position de ce modificateur du taux de recombinaison global à un intervalle de 4,7 Mb (surnommé Meir1 par les auteurs). Ce locus se situe dans une partie plus large du chromosome X précédemment montré pour moduler la recombinaison dans les croisements impliquant d'autres sous-espèces de souris [22,23].


Introduction

Il existe plusieurs processus sous-jacents à la spéciation bactérienne. L'un de ces processus est la recombinaison homologue, dans laquelle du matériel génétique est échangé entre deux molécules d'ADN identiques ou similaires. Ici, l'effet de la recombinaison homologue sur la spéciation est étudié dans Campylobacter foetus, qui montre plusieurs lignées distinctes génétiquement divergentes associées à l'hôte.

Campylobacterfœtus est reconnu comme un agent pathogène vétérinaire important et occasionnel pour l'homme ( van Bergen et al. 2008 Wagenaar et al. 2014). Trois C. fœtus les sous-espèces sont actuellement reconnues : C. fœtus sous-espèce fœtus (Cff) et venerealis (Cfv), qui sont étroitement liés et se produisent chez les mammifères, principalement les ongulés, et C. fœtus subsp. testudinum (Cft), qui est génétiquement différent de Cff et Cfv, et se rencontre principalement chez les reptiles ( Gilbert et al. 2014). Ces sous-espèces présentent une dichotomie d'hôte stricte : Cff et Cfv n'ont jamais été isolés des reptiles, alors que Cft n'a jamais été isolé chez les mammifères, à l'exception de cas humains occasionnels, dans lesquels un contact avec des reptiles est suspecté ( Patrick et al. 2013). La situation actuelle montre deux grandes lignées cohérentes dominantes de C. fœtus chez les mammifères (Cff et Cfv) et les reptiles (Cft). Cependant, au cours d'études indépendantes évaluant la Campylobacter diversité chez les reptiles, une espèce génétiquement distincte C. fœtus la lignée, comprenant les types de séquences multilocus 43 et 69, a été obtenue à partir de tortues à pieds rouges détenues en captivité (Chelonoidis carbonaria) à Taïwan et aux Pays-Bas, s'ajoutant à la diversité génétique de C. fœtus ( Wang et al. 2013 Gilbert et al. 2014). Étonnamment, l'analyse phylogénétique basée sur l'ARNr 16S et le typage de séquences multilocus (MLST) a montré que cette lignée était fortement liée aux mammifères associés Cff et Cfv, bien qu'il ait été isolé chez les reptiles ( Wang et al. 2013).

Il est à noter que la recombinaison était pratiquement absente entre les mammifères Cff/Cfv et associé aux reptiles Cft, ce qui suggère une spéciation allopatrique au sein C. fœtus (Gilbert, Miller, Yee, Zomer, et al. 2016). Une barrière à la recombinaison était apparente, mais il restait à montrer si cela était causé par la dichotomie de l'hôte (associée aux mammifères ou aux reptiles) ou par des facteurs intrinsèques qui inhibent la recombinaison entre ces lignées. Les C. fœtus lignée étroitement liée à celle des mammifères Cff et Cfv, pourtant isolé des reptiles, pourrait jouer un rôle central dans notre compréhension de ces processus.

Sur la base de la comparaison du génome entier, nous explorons la recombinaison homologue entre deux lignées bactériennes génétiquement divergentes, qui se produisent toutes deux naturellement chez un hôte reptilien, et fournissent de nouvelles informations sur la spéciation et l'évolution bactériennes.


L'impact de la recombinaison sur la charge de mutation humaine et la maladie

La recombinaison favorise l'intégrité génomique entre les cellules et les tissus grâce à la réparation des cassures double brin, et est essentielle pour la formation des gamètes et la fertilité grâce à une régulation stricte des mécanismes moléculaires associés à une disjonction chromosomique appropriée. Chez l'homme, des anomalies congénitales et des anomalies structurelles récurrentes peuvent être attribuées à une recombinaison méiotique aberrante. De plus, les mutations affectant les gènes impliqués dans les voies de recombinaison sont directement liées à des pathologies telles que l'infertilité et le cancer. La recombinaison est l'un des mécanismes les plus importants qui façonnent la variation du génome et est associée non seulement à la structuration de la variabilité génomique, mais est également étroitement liée à la purge des mutations délétères des populations. Ensemble, ces observations mettent en évidence les multiples rôles de la recombinaison en génétique humaine : sa capacité à agir comme une force majeure de l'évolution, son potentiel moléculaire pour maintenir la réparation et l'intégrité du génome dans la division cellulaire et son coût mutagène impactant l'évolution de la maladie.

Cet article fait partie du numéro thématique « Causes et conséquences évolutives de la variation du taux de recombinaison dans les organismes sexuels ».

1. Introduction

Les principaux progrès de la génétique des populations humaines au cours de la dernière décennie comprennent la caractérisation des forces génomiques primaires générant et façonnant la variation humaine : mutation [1–4] et recombinaison [5–11]. La recombinaison est un mécanisme clé qui façonne la variation mutationnelle à travers les génomes et son impact est critique dans la biologie évolutive et les maladies humaines. La recombinaison peut être simplement définie comme le processus par lequel les chromosomes échangent du matériel génétique. Dans la méiose, de nouvelles combinaisons du matériel génétique parental sont créées pour être transmises à la progéniture. Dans la mitose, les processus liés à la recombinaison assurent une réparation conservatrice des cassures double brin (DSB) pour minimiser la transmission altérée de l'ADN aux cellules filles.

Du début des années 1930 à la fin des années 1970, les recherches théoriques [12-17] se sont concentrées sur des modèles identifiant les conditions nécessaires à l'évolution de la recombinaison (reproduction sexuée). Dans les années 1980, on a découvert que la recombinaison était essentielle pour stabiliser les chromosomes homologues et assurer une disjonction chromosomique précise pendant la méiose chez les eucaryotes, car les fréquences de croisement anormales étaient en corrélation avec les fréquences d'aneuploïdie [18-20]. De plus, la recombinaison s'est avérée impliquée dans la machinerie de réparation de l'ADN endommagé, qui autrement accumulerait des lésions infligées spontanément ou induites par l'environnement cellulaire environnant [21,22]. Plus récemment, les progrès des méthodes statistiques couplés à de grandes collections de variations génomiques ont permis de mieux comprendre la distribution des taux de recombinaison le long du génome humain et de découvrir que les fréquences de recombinaison sont déterminées par des facteurs génétiques et épigénétiques [5–11].

Dans cette revue, nous nous concentrons sur l'impact de la recombinaison sur l'accumulation de mutations et la maladie chez l'homme en décrivant l'interaction entre les mécanismes moléculaires et évolutifs associés à la localisation et à la régulation de la recombinaison méiotique et mitotique. Plus précisément, nous nous concentrons sur les mécanismes sous-jacents à l'appariement des chromosomes et à l'établissement de croisements ainsi que sur les voies en aval associées à la réparation de l'ADN connues pour entraîner des troubles génomiques en cas de perturbation. Nous commençons par décrire l'association entre les points chauds de recombinaison et son principal régulateur, PRDM9, ainsi que des preuves récentes du rôle de PRDM9 dans l'infertilité et la spéciation. Nous discutons également de l'impact des voies liées à la recombinaison dérégulée sur la fertilité et de la façon dont la recombinaison aberrante affecte les anomalies génétiques structurelles, les malformations congénitales et les maladies. Nous examinons ensuite le rôle de la recombinaison mitotique sur la maladie, en particulier dans le cancer, en examinant les preuves actuelles de l'implication des mécanismes de recombinaison homologue dans la réparation de l'ADN et la tumorigenèse et enfin, le potentiel de la recombinaison mitotique en tant qu'agent mutagène. Pour conclure, nous présentons les preuves actuelles de l'impact de la liaison chromosomique et de la conversion génique biaisée par GC sur l'accumulation de mutations délétères dans les populations humaines.

2. Recombinaison méiotique et infertilité

La recombinaison méiotique est essentielle pour une disjonction chromosomique précise et le maintien de la stabilité génomique pendant la méiose chez les eucaryotes. Au cours de la méiose, le processus de recombinaison est initié par l'introduction de DSB à des emplacements spécifiques du génome, et leur positionnement, réparation et résolution réussis en croisements dépendent de nombreux processus moléculaires essentiels pour assurer l'intégrité du génome. Une variation substantielle du taux et de la distribution des croisements a été trouvée au sein et entre les espèces, les sexes, les populations et les individus. Au sein des génomes, les taux de recombinaison et les emplacements varient selon les chromosomes, à l'échelle des mégabases et des kilobases. Chez les mammifères, la distribution des croisements le long du génome est connue pour varier, et des régions substantielles d'ADN avec une recombinaison inhabituellement faible sont observées, appelées points froids, tandis que des pics de recombinaison très localisés, appelés points chauds, sont également observés. Dans cette section, nous décrivons les mécanismes évolutifs et moléculaires d'une telle variation du taux de recombinaison et leurs implications pour la fertilité chez les mammifères.

(a) Points chauds de recombinaison méiotique, PRDM9 et infertilité

Les premières informations sur la distribution des événements de croisement méiotique chez l'homme ont émergé de l'analyse des modèles d'héritage génétique parmi les familles en se concentrant sur quelques régions spécifiques du génome [23,24]. Plus tard, avec des marqueurs pangénomiques génotypés en familles, des cartes génétiques ont été construites d'abord à l'échelle de la mégabase [25,26] et plus tard à une résolution plus élevée [4,7,8,27]. Des cartes de recombinaison à haute résolution ont révélé la présence de taux de recombinaison hétérogènes à travers le génome et des longueurs de cartes génétiques spécifiques au sexe [27,28], tandis que la caractérisation moléculaire des événements de recombinaison par génotypage de spermatozoïdes unique et groupé a conduit à l'identification et à la caractérisation de points chauds individuels [29-31]. Avec le génotypage des spermatozoïdes, il a été démontré que ces zones correspondent à des groupes de points de rupture de recombinaison couvrant 1 à 2 kb [29].

Le déséquilibre de liaison (LD), l'association non aléatoire d'allèles entre différents loci, est principalement déterminé par les taux locaux de recombinaison : plus le taux est petit, plus la covariation des allèles entre les loci est élevée. À mesure que la distance entre les paires de sites polymorphes augmente, la probabilité qu'un événement de recombinaison se produise entre eux augmente et la covariation est réduite. À travers le génome humain, la LD peut être principalement décrite par de grands blocs d'associations étroites qui sont rompues par intermittence [30,32]. Les méthodes statistiques basées sur la génétique des populations [7,33-37] exploitant les distributions d'associations permettent de caractériser la variation du taux de recombinaison avec une résolution relativement fine. Par exemple, les analyses basées sur la LD ont confirmé que les croisements méiotiques ne sont pas distribués de manière aléatoire dans le génome humain, le plus grand nombre d'entre eux se produisant uniquement dans 10 % du génome et de préférence pas dans les gènes [7].De plus, les méthodes basées sur la LD ont conduit à l'identification de milliers de points chauds de recombinaison à l'échelle du génome, dont l'emplacement est associé à la distribution d'un motif de séquence dégénéré de 13-mères [8,38] crucial dans le recrutement d'une activité de croisement dans au moins 40 % des les points chauds de la recombinaison humaine, quels que soient l'origine et le sexe de la population, et associés à l'instabilité génomique et aux points de rupture responsables de la maladie [38]. Le motif 13-mer a été supposé être le site de liaison d'une protéine à doigt de zinc (ZnF) [38]—le PR domain-contenant 9 (PRDM9), une histone méthyltransférase [9-11]. Des expériences moléculaires et des analyses bioinformatiques ont confirmé l'affinité de liaison de plusieurs allèles PRDM9 ZnF à des motifs spécifiques, y compris le motif de point chaud dégénéré précédemment identifié [9]. Les polymorphismes dans le domaine ZnF de PRDM9 se sont avérés être associés à des motifs de séquence alternatifs et sous-tendent les différences dans l'emplacement des points chauds dans les populations humaines [39]. Il a été rapporté que la modification épigénétique H3K4me3 (la triméthylation de l'histone H3 sur la lysine 4) marque l'activité des points chauds de recombinaison méiotique [40], et des études récentes chez la souris [41] et des lignées cellulaires humaines [42] ont également associé la recombinaison sites d'initiation avec la marque H3K36me3 (la triméthylation de l'histone H3 sur la lysine 36). Fait intéressant, PRDM9 s'est avéré catalyser ces deux marques épigénétiques [41-43]. Ensemble, ces résultats indiquent que les sites de liaison de PRDM9 spécifient l'emplacement des points chauds à l'échelle du génome et contrôlent la distribution des événements de recombinaison, probablement en favorisant l'initiation de la recombinaison via les DSB [44].

Chez les chimpanzés, l'homologue de PRDM9 ne reconnaît pas le motif de liaison à la séquence 13-mère du PRDM9 humain, alors qu'il semble se lier à différents motifs de séquence [10]. De plus, la puce PRDM9 ZnF semble avoir divergé davantage de la contrepartie humaine que toute autre protéine ZnF homologue [10]. Ces observations sont cohérentes avec l'hypothèse selon laquelle les emplacements des points chauds de recombinaison évoluent à un rythme rapide [8,45,46], expliquant les différences dans les distributions des points chauds de recombinaison entre les humains et les chimpanzés [47-50] et les différences entre le courant (génotypage du sperme) et emplacements des points chauds historiques (basés sur LD) [29,45,51]. L'évolution rapide de PRDM9 peut être due au renouvellement rapide des motifs d'ADN sur les sites de recombinaison [10]. Au cours de la réparation DSB sur les sites hétérozygotes, le chromosome homologue contenant l'allèle non recombinogène sera utilisé pour réparer la séquence d'ADN brisée, un mécanisme connu sous le nom de conversion génique, et entraînera l'extinction du motif de liaison PRDM9 [51,52]. Comme l'extinction des points chauds remet en question les exigences d'une ségrégation chromosomique appropriée dans la méiose, de nouvelles variantes de PRDM9 peuvent émerger, capables de reconnaître de nouveaux motifs et d'assurer ainsi le bon fonctionnement de la recombinaison. PRDM9 comprend une structure de type minisatellite ZnF vulnérable aux réarrangements de séquence pendant la réplication de l'ADN et susceptible d'expliquer des niveaux élevés de polymorphisme de la PRDM9 Tableau ZnF [10]. De plus, les polymorphismes mononucléotidiques dans PRDM9 se concentrer sur les acides aminés de liaison à l'ADN de la puce non seulement chez l'homme mais aussi chez les primates et les rongeurs [53]. Ensemble, les preuves suggèrent qu'un taux de mutation élevé et une sélection positive peuvent contribuer conjointement à des taux d'évolution rapides à PRDM9. Une dynamique « Red-Queen » a été proposée pour modéliser l'érosion des motifs, via une conversion génique biaisée, et la génération rapide de nouvelles formes de PRDM9 pour reconnaître de nouveaux sites de liaison et ainsi maintenir les taux de croisement chromosomique a été suggérée à suivre [46,54 –57]. Dans un tel modèle d'évolution, le motif de séquence 13-mer, la cible actuelle de l'allèle humain le plus courant, pourrait être condamné à l'extinction dans les 3 millions d'années à venir [55]. Fait intéressant, alors que PRDM9 joue un rôle unique dans le changement rapide de l'emplacement des points chauds de recombinaison chez les primates et les rongeurs, les groupes taxonomiques dépourvus d'homologues PRDM9 semblent avoir conservé des paysages de recombinaison stables [46,58,59].

Il est important de noter que PRDM9 a été impliqué dans l'infertilité en raison d'un placement anormal des DSB méiotiques et d'un arrêt précoce du pachytène et est le premier (et le seul) gène de « spéciation » à être décrit chez les vertébrés. Bien que les knock-outs de PRDM9 chez la souris provoquent la stérilité chez les deux sexes [43], l'incompatibilité allélique entre Mus musculus musculus et Mus musculus domesticus [60] ne provoque la stérilité hybride que chez les mâles. Des découvertes récentes ont établi le lien entre la stérilité mâle hybride, la variation allélique au PRDM9 et l'asynapsie chromosomique pendant la méiose [61-63]. Un modèle convaincant pour la base mécanistique de la stérilité hybride et de l'asynapsie chromosomique a été proposé, basé sur des analyses de cartes DSB chez des souris transgéniques [63]. L'érosion des motifs PRDM9 conduit à une liaison asymétrique de PRDM9 chez les hybrides, qui est associée à des taux d'asynapsis élevés dans le pachytène et à une régulation négative des gènes autosomiques [64], conduisant potentiellement à des défauts méiotiques majeurs et à la stérilité. Il est donc plausible que ces mécanismes nouvellement découverts affectent les niveaux de fertilité hybride chez d'autres espèces de mammifères avec PRDM9, et jouent peut-être un rôle plus large dans la spéciation.

(b) Méiose, recombinaison et infertilité

La méiose est un processus de développement complexe de deux divisions cellulaires, transformant une cellule diploïde en quatre cellules haploïdes. La première division (méiose I) est caractérisée par une prophase étendue, qui comprend des étapes régissant le mouvement et l'organisation des chromosomes méiotiques. Notre compréhension du contrôle génétique de la méiose provient de différents systèmes expérimentaux [65], avec des informations génomiques et fonctionnelles définissant une « machinerie centrale de recombinaison méiotique » qui présente une forte conservation chez les eucaryotes [66]. L'achèvement réussi de la méiose dépend du positionnement approprié des événements de croisement entre les homologues appariés qui fournissent des connexions temporaires entre les homologues, appelées chiasmata. La formation du chiasma est bien décrite par le modèle de Szostak [67], qui prédit que l'intermédiaire central de la formation du croisement est une structure de jonction d'ADN à quatre voies, connue sous le nom de double jonction Holliday, qui relie physiquement les deux molécules d'ADN en recombinaison et leur permet de s'orienter et se séparent vers les pôles opposés du fuseau en métaphase I [68]. Le complexe synaptonémique couvre l'espace entre les chromosomes appariés pendant la méiose et peut réguler la distribution des croisements à l'échelle des chromosomes [69]. Les erreurs de recombinaison méiotique sont souvent source de mutations néfastes, de chromosomes aberrants et de gamètes défectueux, avec des conséquences cliniques importantes.

De graves défauts génétiques chez les acteurs clés de la prophase I conduisent généralement à l'infertilité en raison de l'apoptose des gamétocytes. Par exemple, chez la souris, les allèles nuls dans les gènes impliqués dans la synapse chromosomique (par ex. SMC1, REC8, SYCP2 et SYCP3) et la réparation du DSB entraînent des taux d'aneuploïdie élevés par arrêt méiotique, une fertilité très réduite ou même une infertilité [70-74]. Chez la souris également, la sensibilité à la perturbation méiotique est souvent sexuellement dimorphe. Certains défauts génétiques affectant la progression de la prophase I conduiront à des mâles stériles à la suite de l'apoptose des spermatocytes, tandis que les femelles restent pleinement fertiles ou sous-fertiles (par ex. FKBP6, PRDM9). Dans d'autres cas, la progression méiotique s'arrête à différents stades chez les femmes et les hommes, révélant des fonctions moléculaires distinctes des principaux acteurs méiotiques, ou des points de contrôle altérés sur les phénotypes liés à la recombinaison chez les deux sexes (SPO11, RAD51C) [75,76]. On ne sait pas si la nature sexuellement dimorphe des gènes méiotiques impliqués à la fois dans la recombinaison et l'infertilité est récapitulée chez l'homme, mais des différences importantes entre les sexes dans les taux de recombinaison sont largement établies [27,28,77-79]. Par exemple, les taux de croisement à l'échelle du génome chez l'homme sont en corrélation avec les polymorphismes dans RNF212 [80], avec des haplotypes augmentant le taux de recombinaison dans un sexe associé à un taux de recombinaison réduit dans l'autre [81].

Chez l'homme, l'infertilité est un problème relativement courant, mais les mutations causant l'infertilité dans les gènes méiotiques sont restées largement insaisissables, à l'exception de SPO11, SYCP3, PRDM9 et CDK2 mutations [82-86]. Même lorsque de nouvelles associations sont signalées, l'identification des polymorphismes et des mécanismes responsables reste problématique. Cependant, une stratégie d'édition du génome CRISPR/Cas9 a réussi à modéliser des variantes potentiellement délétères dans les orthologues de souris des gènes de fertilité humaine [85]. Alternativement, la génération de cellules germinales primordiales à l'aide de cellules souches pluripotentes induites provenant de patients infertiles est susceptible de fournir de précieux in vitro modèles génétiques pour améliorer notre compréhension des mécanismes méiotiques provoquant l'infertilité chez l'homme [87].

3. Troubles génomiques méiotiques et mitotiques

(a) Une recombinaison aberrante favorise l'instabilité génomique

Chez l'homme, la recombinaison méiotique altérée est associée à de grands réarrangements structurels, à des aneuploïdies et à l'infertilité. Ces instabilités sont principalement causées par des perturbations à différentes étapes du processus moléculaire, comme brièvement résumées dans le tableau 1. En effet, la recombinaison méiotique altérée est le premier corrélat associé à une ségrégation chromosomique anormale survenant dans au moins 5% des grossesses humaines cliniquement reconnues, faisant de l'aneuploïdie le principale cause de fausse couche [88]. On estime que plus de 20 % des ovocytes humains sont aneuploïdes, contre seulement 2 % des spermatocytes [88] même si les mâles humains ont des taux de recombinaison inférieurs, mettant en évidence une différence dramatique entre la régulation femelle et mâle de la ségrégation chromosomique. Les facteurs moléculaires de ce processus sujet aux erreurs sexuellement dimorphes restent largement inconnus, à l'exception des perturbations dans les voies de croisement, qui sont associées à la non-disjonction. Chez l'homme, une réduction significative du nombre d'événements croisés est une caractéristique de toutes les trisomies étudiées [88] et des chiasmes positionnés de manière sous-optimale sont fréquemment observés, de sorte que les échanges se produisant trop près du centromère, ainsi que trop loin, sont des facteurs de risque de non-disjonction [104–108].

Tableau 1. Maladies associées à des mécanismes de recombinaison dysfonctionnels.

De plus, les taux d'aneuploïdie augmentent avec l'âge chez les femmes. Cet « effet âge maternel » est particulièrement prononcé : avant 25 ans, une femme a 2% de chance d'avoir une grossesse trisomique, mais au-delà de 40 ans, cette chance monte à 35%. Cet effet serait dû aux atteintes du système méiotique liées à l'âge à chaque étape du développement de l'ovocyte [109]. Un certain nombre d'études ont analysé différentes cohortes pour déterminer s'il existe une relation similaire liée à l'âge avec la recombinaison [110–114], avec une relation positive, négative ou aucune relation entre le nombre de chiasmas et l'âge étant observée. Néanmoins, les tailles d'effet et la variance expliquées par l'âge sur la fréquence du chiasma sont soit petites soit insignifiantes à l'échelle du génome, et la recombinaison seule est peu susceptible d'être responsable des effets de l'âge maternel sur les aneuploïdies.

Une gamétogenèse aberrante conduisant à des anomalies génétiques structurelles récurrentes est une cause majeure de malformations congénitales congénitales. Les DSB sur les sites de recombinaison seront parfois réparés de manière aberrante avec des loci non homologues, dans un processus appelé recombinaison homologue non allélique (NAHR, tableau 1), qui entraîne des réarrangements structurels. Dans la plupart des cas, les réarrangements sont encadrés par de faibles répétitions de copies qui partagent généralement une similarité de séquence supérieure à 98 %. Généralement, les séquences d'ADN répétées jouent un rôle important dans la médiation des erreurs de recombinaison causant des maladies. Un appariement et une recombinaison homologue entre des éléments répétitifs désalignés ont été observés aux points de rupture de réarrangement liés à la maladie et sont considérés comme le principal mécanisme de NAHR [89]. La NAHR peut entraîner des inversions et des translocations chromosomiques ou des duplications et délétions locales. Ces réarrangements sont susceptibles de perturber considérablement les gènes, créant éventuellement des gènes de fusion, et sont pour la plupart délétères. Les troubles génomiques associés à la NAHR comprennent : la maladie de Charcot-Marie-Tooth de type 1A, la neurofibromatose de type 1, le syndrome de Williams-Beuren, le syndrome de Smith-Magenis, la neuropathie héréditaire avec risque de paralysie de pression, le syndrome de DiGeorge, le syndrome de Prader-Willi, l'amyotrophie spinale infantile et le syndrome de microdélétion 17q21.31 (tableau 1). Beaucoup d'entre eux résultent de duplications à l'échelle de la mégabase, comme dans la maladie de Charcot-Marie-Tooth [115], ou de délétions, comme dans les syndromes de Smith-Magenis, Williams-Beuren, DiGeorge et Prader-Willi. Les points de rupture pathogènes et autres NAHR ne sont pas répartis uniformément le long des répétitions de faible copie et se regroupent dans des points chauds étroits [116] qui se trouvent souvent à des positions étonnamment similaires à celles des points chauds résultant de la recombinaison allélique [117,118]. De plus, les points chauds NAHR et les points chauds de recombinaison partagent des propriétés similaires de distribution de l'échange de brins [118], suggérant qu'ils sont fonctionnellement liés. De nombreux éléments de preuve suggèrent également que PRDM9 la variation est corrélée à l'instabilité des répétitions minisatellites [38] et aux réarrangements pathologiques récurrents, tels que les délétions/duplications 17p11.2 [119] et les microdélétions 7q11.23 [120]. Des duplications ou délétions récurrentes en 17p11.2 sont impliquées dans la maladie de Charcot-Marie-Tooth et la neuropathie héréditaire avec risque de paralysie de pression, tandis que les microdélétions 7q11.23 provoquent le syndrome de Williams-Beuren. PRDM9 semble ainsi être impliqué dans des instabilités méiotiques conduisant à des troubles génomiques.

Il semble y avoir une composante dépendant du sexe à certains réarrangements, qui ne surviennent pas aux mêmes fréquences dans les méioses paternelles et maternelles. Par exemple, la duplication ou la délétion en 17p11.2, associée à la maladie de Charcot-Marie-Tooth ou à la neuropathie héréditaire avec risque de paralysie de pression, respectivement, résulte de deux mécanismes distincts dépendant du sexe [121]. La plupart des réarrangements de novo sont d'origine paternelle et surviennent par NAHR entre les deux homologues du chromosome 17, alors que les rares réarrangements d'origine maternelle résultent d'un processus intra-chromosomique. Fait intéressant, cette région du chromosome 17 semble avoir des taux de recombinaison plus élevés chez les femmes que chez les hommes, ce qui suggère que l'ovogenèse peut offrir une meilleure protection contre le désalignement pendant la synapsis, ou que des facteurs spécifiques aux hommes peuvent opérer pendant la spermatogenèse pour aider à stabiliser les réarrangements. Alternativement, les différences spécifiques au sexe pourraient refléter un biais de sélection différent contre les allèles réarrangés dans les lignées germinales mâles et femelles. Des différences de fréquence de NAHR entre hommes et femmes ont également été observées sur d'autres loci, avec des délétions d'amyotrophie spinale infantile provenant principalement de la spermatogenèse [122], alors que 80 % des délétions de novo de neurofibromatose de type 1 sont d'origine maternelle [123].

(b) Recombinaison homologue mitotique et maladie

Des parallèles semblent exister entre la recombinaison méiotique et la tumorigenèse dans les cellules somatiques : outre le rôle de la recombinaison homologue dans la promotion de la stabilité génomique en réparant les DSB dans les cellules en mitose [124,125] et la machinerie moléculaire chevauchante impliquée [98,126,127], une expression aberrante des protéines exclusivement exprimée dans des testicules adultes sains, et associée à des fonctions spécifiques de la méiose, a récemment été observée dans des tumeurs provenant de tissus non germinaux [128]. De plus, PRDM9 et la protéine de cohésion des chromatides inter-soeurs RAD21 L se sont avérés être exprimés dans certaines lignées cellulaires cancéreuses [129]. En raison des fonctions spécifiques de la recombinaison méiotique de ces protéines, il a été émis l'hypothèse qu'elles pourraient interférer avec la régulation du génome mitotique [128].

L'intégrité du génome dans les cellules mitotiques repose en grande partie sur la recombinaison, nécessaire pour une réparation précise des DSB subies soit par des processus exogènes (par exemple, la lumière ultraviolette) ou endogènes (par exemple, des dommages subis lors de la réplication) pendant la vie de la cellule [130]. En raison du rôle essentiel de la recombinaison mitotique dans l'intégrité du génome, le dérèglement des mécanismes moléculaires impliqués peut souvent conduire à des maladies, dont le cancer (tableau 1). La recherche sur l'effet de la recombinaison mitotique sur la progression de la tumorigenèse s'est largement concentrée sur la compréhension de l'impact des mutations de perte de fonction dans les gènes suppresseurs de tumeur qui font partie de la voie de réparation par recombinaison homologue (HRR), tels que ceux inclus dans la reconnaissance de la DSB par le complexe MRE11A-NBS1-RAD50, la résection d'ADN guidée par BRCA1 ou la localisation de la recombinase RAD51 par BRCA2 [98,131,132]. La perte de mutations fonctionnelles dans les gènes impliqués dans la voie HRR conduit souvent à son inactivation, rendant la réparation des DSB entièrement dépendante de la voie alternative de jonction terminale non homologue. La voie de jonction d'extrémité non homologue n'implique pas de séquences homologues comme matrice de réparation, ce qui entraîne de petites insertions et délétions aux emplacements des points de rupture [133] et laisse donc une signature mutationnelle distincte, caractérisée par des réarrangements génomiques accrus et de petits indels, dans tumeurs avec inactivation de la voie HRR [134]. La capture de la signature génomique sous-jacente à l'inactivation de la voie HRR est importante dans la recherche sur le cancer, étant donné le succès thérapeutique des inhibiteurs de la poly(ADP-ribose) polymérase qui ciblent les tumeurs déficientes sur la voie HRR [135,136]. En empêchant les réarrangements génomiques grâce à la réparation précise des DSB hautement dommageables, les processus de recombinaison mitotique sont essentiels pour assurer la stabilité génomique, bien que les processus de recombinaison puissent également être mutagènes lorsqu'ils tournent mal.

Les événements de recombinaison mitotique mutagène peuvent être principalement identifiés par : (i) une variation structurelle générée par NAHR ou (ii) une perte d'hétérozygotie (LOH) induite par une conversion génique biaisée (figure 1). Les algorithmes de détection de variation structurelle peuvent être utilisés naïvement pour détecter des événements NAHR [141]. Cependant, comme le NAHR implique souvent des loci répétitifs partageant une homologie élevée, les algorithmes de variation structurelle identifient les événements NAHR avec des taux d'erreur élevés. Parcs et al. [141] ont développé un modèle probabiliste bayésien améliorant la détection de la NAHR à partir des données de séquençage en se concentrant sur les régions sujettes à la NAHR par leur nature répétitive, qui complète les algorithmes de détection de variation structurelle en améliorant leur détection. L'analyse des puces chromosomiques d'une cohorte de 25 144 patients atteints de la maladie a récemment répertorié les variantes du nombre de copies médiées par la NAHR parmi de nombreuses maladies (tableau 1) [90]. De plus, la NAHR mitotique, trouvée dans un motif en mosaïque à travers les cellules, semble être associée à des maladies impliquant des gènes avec un grand nombre de répétitions telles que les loci de la neurofibromine-1 [91] (tableau 1), impliquant en outre la mutagénicité de la recombinaison mitotique pour maladie.

Figure 1. Conversion génique conduisant à des événements LOH dans les cellules tumorales. (une) Une cellule tumorale potentielle qui a subi une LOH augmentera en fréquence en tant que sous-population dans un tissu ou une tumeur. (b) Une cellule réparant un DSB à médiation via un croisement ou non, donnant lieu à deux cellules filles présentant LOH.Les exemples présentés correspondent à un modèle dans lequel la voie de réparation DSB est suivie par la résolution d'une double jonction Holliday, bien que d'autres mécanismes puissent conduire à une conversion génique (comme décrit dans [137-139]). Des bases mésappariées peuvent provenir de la synthèse d'ADN lorsque la chromatide sœur est utilisée comme matrice pour la réparation, entraînant un échange non réciproque entre les deux brins d'ADN [140]. La LOH se produit pendant la conversion génique lorsque les variants de la lignée germinale sont hétérozygotes (comme indiqué). Si une recombinaison homologue se produit lors d'une invasion de chromatides à deux homologues, comme c'est le plus souvent le cas, seul un modèle sans croisement conduit à LOH, alors qu'avec une invasion à quatre chromatides, les croisements et les non-croisements ne conduisent à LOH que lorsque les chromatides recombinantes se séparent en la même cellule fille. (c) Les événements LOH peuvent être capturés en comptant le nombre de lectures de séquençage à partir d'échantillons tumoraux portant les allèles alternatifs sur des sites hétérozygotes identifiés dans la lignée germinale (ou tissu sain). Néanmoins, des défis sont associés à la détection des événements LOH à partir des données de séquençage. En raison du mélange cellulaire dans la tumeur, le signal des événements LOH peut être perdu et peut ne pas être distingué des erreurs de séquençage et des effets de biais de cartographie.

On pense généralement que la conversion génique mitotique est associée à la tumorigenèse, car les événements LOH locaux sont fréquents parmi les génomes tumoraux [142,143]. Notamment, la LOH de l'allèle de type sauvage des suppresseurs de tumeurs est fréquemment et récurrente observée. La détection de LOH est possible par séquençage et identification de loci hétérozygotes dans le génome germinatif qui sont homozygotes dans le génome tumoral (figure 1c) [137]. Traditionnellement, les événements LOH étaient capturés en détectant les changements caryotypiques [144], tandis que les nouvelles méthodes exploitent les nombres de lectures à partir de séquences à haut débit [145] et les informations de matrice SNP [143]. Les événements de conversion génique mitotique conduisant à la LOH sont identifiés une fois qu'ils ont atteint la fixation dans la population tumorale en raison de leur avantage sélectif élevé sur la croissance tumorale, tandis que les allèles passagers générés par la conversion génique mitotique avec des effets neutres seront beaucoup moins susceptibles d'être trouvé à haute fréquence dans les cellules tumorales. Certains événements LOH sont probablement dus à l'instabilité générale du génome, ce qui rend difficile de distinguer quels événements LOH sont associés à l'instabilité génomique et lesquels en sont la conséquence. Néanmoins, l'inférence LOH a été utilisée pour identifier les facteurs de cancer candidats, car il est probable que la perte d'un allèle dans les populations clonales cancéreuses confère un avantage sélectif pour la progression du cancer, comme la perte de fonction des allèles de type sauvage de MLH1/MSH2. [146].

Enfin, certaines régions génomiques sont sujettes à des événements de recombinaison mitotique, notamment Alu éléments transposables, qui se trouvent en outre à proximité d'événements de translocation de leucémie [147], suggérant un lien entre l'effet mutagène de la recombinaison mitotique et la leucémogenèse [103].

4. Evolution et impact fonctionnel du sexe et de la recombinaison

(a) Avantages évolutifs de la recombinaison

Fisher [12] et Muller [13] ont proposé que la reproduction sexuée et la recombinaison soient avantageuses sur le plan de l'évolution car elles accélèrent le taux de fixation des mutations bénéfiques et donc le taux d'adaptation en rassemblant sur le même chromosome des allèles bénéfiques qui apparaissent initialement sur différents milieux génomiques. . Plus tard, en supposant que la plupart des mutations sont délétères, Muller a proposé qu'en l'absence de recombinaison, les mutations désavantageuses s'accumulent de manière irréversible de sorte qu'un état sans mutation ne puisse jamais être récupéré (les mutations inverses sont rares), le cliquet de Muller effet [14]. Ces modèles théoriques initiaux ont été étendus par l'introduction d'hypothèses supplémentaires sur le rôle de la dérive aléatoire, de la sélection et du couplage. De tels développements ont conduit à l'émergence de concepts tels que l'interférence de Hill-Robertson (HR), qui postule qu'en présence de dérive et de liaison, les loci liés soumis à la sélection interfèrent avec les trajectoires de fréquence allélique des autres au fil du temps [15,17]. Les fréquences alléliques sur un site ne dépendront pas seulement de la dérive et de leur fitness évolutif, mais dépendront également de la fitness des génotypes liés. La persistance des associations entre loci générées par l'interférence HR dépend du taux de recombinaison entre eux : plus le taux de recombinaison est faible, plus ces associations dureront longtemps.

La sélection sur des mutations bénéfiques conduit les mutations cibles à la fixation, augmentant la LD et diminuant la diversité neutre dans les régions environnantes liées (figure 2une), communément appelés balayages sélectifs. On pensait que la sélection positive était responsable des creux de diversité génétique et d'une différenciation élevée des populations dans ou à proximité des régions géniques [149] ainsi que dans les régions de faible recombinaison [150]. Cependant, les signatures de balayage sélectif complètes à travers le génome se sont avérées rares [151] et au lieu de cela, les faibles niveaux de diversité dans les régions de faible recombinaison sont plus susceptibles d'avoir été générés par la sélection de fond contre des mutations délétères [152-154] (figure 2b). Dans un scénario de sélection positive et en présence d'interférence HR [17,148,155], des mutations légèrement délétères peuvent atteindre des fréquences élevées lorsqu'elles sont voisines de la cible de sélection positive (losange vert, figure 2une). Dans le cas d'une sélection de fond avec interférence HR, les mutations avantageuses apparaissant sur un chromosome porteur de plusieurs mutations délétères auront une chance plus faible, voire nulle, de se propager dans la population (étoile grise, figure 2b). De plus, en présence d'interférence HR, la sélection contre des mutations liées légèrement délétères interférera avec l'élimination des allèles nocifs voisins de faible effet sur des haplotypes alternatifs [156]. L'impact de l'interférence des RH sur l'efficacité de la sélection peut être décrit comme un processus associé à une réduction de la taille effective de la population à un locus sous sélection et aux loci environnants, réduisant la variation et l'efficacité de la sélection. La recombinaison a le potentiel d'augmenter la taille effective de la population localement en recombinant les allèles sélectionnés sur d'autres milieux, ce qui rend la sélection naturelle plus efficace.

Figure 2. Schéma de l'interférence des RH sous des régimes de sélection alternatifs : (une) des mutations avantageuses surviennent sur différents milieux (haplotypes), interfèrent les unes avec les autres et empêchent la fixation de l'autre. Les variantes neutres et légèrement délétères liées augmenteront en fréquence jusqu'à ce que la recombinaison génère de nouveaux haplotypes, qui conduisent rapidement les mutations bénéfiques (maintenant dans le même haplotype) à la fixation tout en purgeant les allèles légèrement délétères. (b) Des allèles délétères entrent dans la population sur différents haplotypes. Par dérive et/ou interférence avec des mutations sélectives avantageuses, elles restent à des fréquences basses dans la population jusqu'à ce que la recombinaison génère un nouvel haplotype résultant de la combinaison des deux allèles délétères. La sélection supprimera ce nouvel haplotype plus efficacement. Cependant, une mutation avantageuse sera perdue, étant donné qu'il n'y avait pas assez de temps pour que la recombinaison rompe son association avec un fond délétère. (c) Sélection négative sur plusieurs mutations légèrement délétères liées (appelée effet HR faible dans Charlesworth et al. [148]) - en raison de la charge limitée portée par de telles mutations, des variants légèrement délétères ont tendance à rester et à s'accumuler dans les populations. Les haplotypes qui portent une charge mutationnelle plus importante peuvent être successivement retirés de la population. L'interférence se produit lorsqu'il y a peu ou pas de recombinaison, et la sélection à d'autres loci sur différents haplotypes réduit la taille effective de la population, ce qui a un impact sur la vitesse à laquelle elles sont perdues de la population en rendant plus difficile l'élimination des haplotypes porteurs de ces mutations délétères. La recombinaison combine les chromosomes pour créer des haplotypes exempts ou chargés de mutations délétères, augmentant ainsi l'efficacité de la sélection. Des exemples de mutations le long des chromosomes (lignes grises) sont représentés par différentes couleurs.

(b) Impact de la recombinaison sur la diversité génomique et la charge de mutation chez l'homme

La variation de l'exome parmi les populations humaines a révélé que les humains sont porteurs d'un nombre étonnamment élevé de mutations potentiellement dommageables ou pathogènes [157-159]. Comprendre pourquoi le fardeau mutationnel persiste nécessite de comprendre le rôle de la démographie de la population et de l'histoire de la recombinaison dans l'accumulation de mutations délétères. Plusieurs études ont montré que les petites populations humaines abritent une variation fonctionnelle relativement plus dommageable, par rapport au nombre de variantes neutres, par rapport à leurs plus grandes populations d'ancêtres [157, 160, 161]. Une charge mutationnelle élevée dans les petites populations peut être causée soit par la consanguinité, soit par une diminution de l'efficacité de la sélection dans l'élimination des mutations potentiellement dommageables. Bien que les études ne soient pas d'accord sur l'existence de différences significatives dans la charge totale de mutations parmi les populations ayant des antécédents démographiques différents [162,163], aucune des études ci-dessus n'a évalué l'impact de l'hétérogénéité génomique dans les fréquences de recombinaison sur la charge de mutation. Plus récemment, en comparant les schémas d'accumulation de mutations dommageables putatives dans des régions avec des taux de recombinaison faibles (points froids) et élevés (points chauds), Hussin et al. [164] ont montré que les régions codantes avec de faibles taux de croisement hébergent des quantités relativement plus importantes de mutations potentiellement dommageables que les régions hautement recombinées, ce qui est cohérent avec une efficacité réduite de la sélection purificatrice pour purger les variations nocives dans les points froids. De plus, l'efficacité de la sélection purificatrice s'est avérée diminuer à mesure que le nombre d'allèles sélectionnés sur le même haplotype augmente, ce qui est cohérent avec l'interférence HR, cet effet étant amplifié à mesure que la taille effective de la population diminue (figure 2c).

Alors que les taux de recombinaison ont été trouvés pour façonner la diversité le long du génome humain principalement en augmentant l'efficacité de la sélection naturelle [164-166], il existe des preuves de l'impact local de la recombinaison sur l'évolution des séquences via la conversion de gènes biaisée par GC [46,138,167,168]. La conversion génique biaisée par GC entraîne la transmission non réciproque du contenu génomique pendant le processus de recombinaison et augmente la probabilité de transmission des allèles GC sur AT. La transmission biaisée des allèles GC peut finalement provoquer la fixation locale des allèles GC dans les points chauds [169], contribuant probablement à la charge de mutation humaine [138, 170]. Bien que la conversion de gènes biaisée par GC à l'échelle du génome soit une force évolutive relativement faible [166,171], ce processus peut entraîner une augmentation du fardeau de la maladie lorsque les allèles dérivés récessifs ont une plus grande chance de transmission en raison de la conversion de gènes biaisée par GC [171]. De plus, il a été suggéré que la conversion de gènes biaisée par GC a évolué pour compenser la charge mutationnelle directement associée aux taux de mutation élevés causés par la désamination des cytosines méthylées aux points chauds de recombinaison [172].

5. Conclusion et perspectives d'avenir

Au cours de la dernière décennie, notre compréhension de la méiose et de la régulation moléculaire de la recombinaison s'est considérablement améliorée [68,172]. Nous avons appris que la localisation génomique des DSB, qui favorisent l'initiation de la recombinaison méiotique, est distribuée de manière non aléatoire et contrôlée par des facteurs génétiques et épigénétiques tels que PRDM9 [7,8,10,43,173–175] et des interacteurs potentiels [46,176,177]. Bien que les processus catalysés par la liaison de PRDM9 soient importants, il est tout aussi essentiel que nous caractérisions les facteurs moléculaires contribuant au recrutement initial de PRDM9 sur ses sites de liaison (voir la revue de Tiemann-Boege et al. dans ce numéro [46]). Les différences d'intensité des points chauds DSB ne sont que partiellement expliquées par la variation génétique au niveau des sites de liaison PRDM9 [44]. Cela suggère que tous les sites potentiels de liaison de PRDM9 n'entraîneront pas de DSB et n'initieront pas le processus de recombinaison, avec des preuves récentes de niveaux supplémentaires de régulation impliquant les gènes KRAB-ZNF dans la suppression de la recombinaison méiotique [178]. L'état local de la chromatine influence la liaison de PRDM9, mais il reste à étudier comment le contexte de séquence plus large et l'accessibilité de la chromatine sont associés à des différences d'intensité des points chauds DSB chez les individus porteurs des mêmes allèles PRDM9. Une hypothèse intrigante est que la fertilité peut être influencée par l'allèle spécifique que l'on porte, s'il affecte positivement l'expression de gènes méiotiques importants, tels que CTCFL [178]. De plus, alors que certains faux-sens PRDM9 des mutations ont été associées à l'infertilité chez l'homme [84,86], une variante de perte de fonction de PRDM9 chez une femme fertile a récemment été observée [179], soulevant l'existence possible d'un dimorphisme sexuel dans l'infertilité associée à la recombinaison dans notre espèce . Ensemble, cela suggère que chez l'homme, PRDM9 pourrait ne pas être impératif pour le bon fonctionnement des processus de recombinaison, car des facteurs compensatoires peuvent exister, au moins chez les femmes humaines.

Malgré de tels progrès, les étapes clés du programme méiotique des mammifères sont mal comprises, car la méiose reste difficile à étudier en raison du manque de données appropriées. in vitro des modèles. Par exemple, les techniques cytologiques nécessitent des biopsies de tissu ovarien fœtal ou des biopsies testiculaires, mais plus important encore, ces méthodes ne peuvent pas être utilisées pour des analyses à haute résolution des DSB et des croisements (voir [180] pour l'exception). D'autre part, les tests de génotypage des spermatozoïdes, qui reposent sur l'amplification par PCR de l'ADN d'un seul spermatozoïde et d'un pool de spermatozoïdes, peuvent examiner des milliers de méioses d'un seul individu à des résolutions inférieures à 0,5 kb [181], le compromis étant qu'il reste techniquement difficile d'étudier des régions génomiques de plus de 300 kb à haute résolution.

Plus récemment, de nouvelles techniques ont été développées pour faciliter l'identification à l'échelle du génome des marques épigénétiques, des sites de recombinaison et de l'organisation des nucléosomes dans la méiose [41,46,181-184]. Ces approches cartographient généralement directement les sites DSB et, bien qu'elles ne cartographient pas directement les croisements, la formation de DSB est le prélude à la recombinaison. L'un de ces tests, utilisant l'immunoprécipitation de la chromatine suivie d'un séquençage (ChIP-seq) et d'une détection sensible de l'ADN simple brin, a révélé que PRDM9 n'est pas nécessaire pour que les DSB se produisent chez la souris, mais les éloigne plutôt des sites promoteurs marqués par H3K4me3. [185]. De plus, les données ChIP-seq H3K36me3 et H3K4me3 dans les spermatocytes montrent que PRDM9 est capable de placer les deux marques épigénétiques sur la même molécule d'histone in vivo, une signature exclusive aux hotspots de recombinaison [41]. Enfin, une nouvelle technique de résolution de nucléotides, qui séquence de courts oligonucléotides liés de manière covalente à SPO11, fournit une description détaillée des points chauds DSB, les localisant parmi les nucléosomes méthylés, et a mis en évidence l'importance de la kinase ATM dans la formation du chromosome sexuel et du DSB autosomique. paysage [186]. L'application de ces nouvelles techniques s'est jusqu'à présent limitée à l'étude de la recombinaison mâle, mais de nouvelles approches émergent pour étudier directement la méiose féminine et fournir des informations précises sur la méiose dans les ovocytes humains. Par exemple, il est maintenant possible de générer des cartes à l'échelle du génome des croisements et des schémas de ségrégation chromosomique en récupérant les trois produits d'une seule méiose femelle, à savoir les deux corps polaires et l'ovocyte activé, permettant l'analyse des tétrades humaines [185,187,188]. De même, les analyses génomiques d'ovocytes humains uniques en utilisant les corps polaires et en récupérant le pronucléus femelle des zygotes peuvent être effectuées avec une technologie de séquençage basée sur le cycle d'amplification basée sur l'hybridation multiple et l'amplification [189]. Ces technologies ont soutenu la génération de cartes de croisement d'ovocytes à l'échelle du génome et offrent une meilleure détection des anomalies chromosomiques.

Enfin, notre compréhension de l'impact de la conversion génique biaisée par les GC, de la pulsion méiotique et de la mutagénicité liée à la recombinaison, au-delà des réarrangements chromosomiques à grande échelle, sur la charge mutationnelle individuelle peut bénéficier considérablement du séquençage unicellulaire en permettant la mesure des mutations de novo dans la lignée germinale [189-191]. Le séquençage unicellulaire des transcriptomes des gamètes permettrait notamment de mieux comprendre l'instabilité de répétition survenant dans la séquence codante PRDM9 ZnF [192], et la vitesse à laquelle de nouveaux allèles de PRDM9 sont générés. À mesure que les coûts des technologies de séquençage unicellulaire diminuent, nous serons en mesure de disséquer des populations de gamétocytes complexes et hétérogènes, ce qui nous éclairera sur la mesure dans laquelle les points chauds spécifiques à chaque individu diffèrent de la distribution attendue des points chauds et comment ces exceptions affectent la santé humaine.


A. Décomposition de la covariance et loi de la covariance totale

La loi de covariance totale stipule que (17) Comme dans Matériaux et méthodes, on définit des variables aléatoires pour deux sites séparés par la distance je comme et où je est un site, et k est une paire de séquences. On note que puisque l'espérance est prise sur le même ensemble de sites dans les deux cas. L'expression peut donc être écrite de manière équivalente comme Ensemble avec l'équation 5 et la loi de covariance totale (réglage ), nous avons (18) De même, en utilisant les équations 6 et 7 (réglage ), nous obtenons (19) La covariance totale, est la covariance des variables de substitution à n'importe quelle paire de sites séparés par la distance je (c'est à dire., sur tous les sites et toutes les paires de séquences). Il peut être calculé soit en conditionnant sur la paire de séquences, soit en conditionnant sur le site de toute façon, le résultat est bien sûr le même, ce qui donne la décomposition de covariance (20) Alors qu'une telle décomposition serait possible pour tout arrangement bidimensionnel de données aléatoires. variables (par exemple., spins magnétiques sur un réseau), une caractéristique intéressante de notre application de génétique des populations est qu'une variance apparaît sur le côté gauche plutôt qu'une covariance. Cela se produit parce que les variables aléatoires et s'avèrent identiques, ce qui est dû au génome circulaire. Le même résultat tient également à une excellente approximation pour un très grand génome, avec des corrections d'ordre On obtient donc l'inégalité de covariance mutationnelle

B. Taux de coalescence

Le modèle général de coalescence échangeable est défini par un ensemble de taux de coalescence, , avec lesquels tout sous-ensemble de k hors de b les lignées ancestrales fusionnent en un seul ancêtre commun. Ces taux satisfont une relation d'auto-cohérence (voir Pitman 1999 Sagitov 1999 Schweinsberg 2000 Brunet et al. 2008). Pour le modèle de Moran, nous avons pour tous puisque est le nombre total de paires qui pourraient fusionner et, puisque seules les fusions par paires sont possibles, pour tous (Moran 1958). Pour le modèle de Schweinsberg, on obtient (22) et, puisque sa généalogie suit la BSC, on a (23) Par commodité, on prend pour le modèle de Moran, et pour le modèle de Schweinsberg, de sorte que les deux modèles ont le même g modifie arbitrairement uniquement l'unité de tous les temps et ne modifie aucun résultat ci-dessous. Les calculs de coalescence explicites ne sont pas effectués pour le modèle de population adaptatif à la place, les résultats de simulation dans les limites de la sélection faible et forte sont comparés aux prédictions théoriques des modèles KC et BSC. Cela nécessite de faire correspondre les taux de coalescence globaux des simulations avec la théorie, ce que nous accomplissons en mesurant directement dans les simulations.

C. Calcul de la diversité de la population

Nous considérons les substitutions sur un site unique sur une paire de séquences génomiques choisies au hasard et comme le montre la figure 6A, et analysons la dynamique de l'endroit où p est la probabilité que ces deux séquences soient identiques à ce site. Nous retraçons leur histoire en un instant et calculons les taux et les résultats des différents événements qui affectent les séquences, y compris la coalescence due à la reproduction, au transfert d'ADN et à la mutation.

Premièrement, un événement de coalescence dans lequel l'un des ou reproduit et remplace l'autre produit une identité sur le site, indiqué par une étoile sur la figure 6A correspondant à l'état et se produit avec le taux Le changement du vecteur d'état est ensuite Deuxièmement, un transfert d'ADN interne , qui se produit entre la paire de séquences en question (figure 6A), donne le même résultat que la coalescence, et donc le même En effet, un tel transfert d'ADN interne est analogue à un événement de reproduction dans le sens où un morceau d'ADN « se reproduit » de la séquence donneuse et remplace son homologue dans la séquence receveuse. Le taux de tels événements est Un transfert d'ADN externe, d'autre part, dans lequel le morceau d'ADN est copié à partir d'une troisième séquence ou ne modifie pas la probabilité que les deux séquences soient identiques sur le site, et ne modifie donc pas la vecteur d'état, c'est à dire., Troisièmement, nous supposons que les mutations se produisent indépendamment à chaque site et uniformément le long de la séquence. Une mutation provoque un changement qui peut être représenté comme un opérateur linéaire agissant sur Le taux global de mutations pour deux sites est et l'opérateur linéaire est donné par (24) En additionnant les changements possibles dus à chaque événement multiplié par leurs taux, nous trouvons ( 25) En définissant la dérivée à zéro, nous obtenons la solution à l'état stationnaire pour (26) où Pour le cas, cela donne l'expression bien connue de l'hétérozygotie dans le modèle de Moran.

D. Calcul des fonctions de corrélation

On considère une paire de sites, une et b, séparés par la distance je, dans une paire de séquences génomiques choisie au hasard, et Les séquences peuvent différer à 0, 1 ou 2 sites, et nous écrivons la distribution de probabilité de ces trois possibles États comme lorsque les composants sont des nombres non négatifs totalisant 1. Plus généralement, une paire de sites peut être configurée sur 2, 3 ou 4 séquences, comme le montre la figure 6B. En raison de l'effet de la liaison génétique, la distribution des états dépend de la configuration. On désigne donc par la distribution des états pour 2, 3 ou 4 séquences choisies au hasard.

Les fonctions de corrélation et ainsi que sont déterminées par les valeurs de quatre termes différents (voir les équations 4 à 7) : (27) (28) (29) (30) où Pour les grands N, on obtient (31) Etant donné que la taille maximale des segments transférés, bien plus petite que la longueur génomique ( ), est déterminée en grande partie par la queue plate de pour laquelle on note (32) Cela correspond à des loci suffisamment éloignés tels qu'ils ne sont pas affectés par les transferts à deux sites, ce qui signifie et donc des rendements d'approximation similaires (33) Sur la base des équations 4 à 7, les calculs de et sont réduits à l'analyse de (34) (35) (36) (37) Pour analyser la dynamique de nous choisissons au hasard je séquences, retracer leur histoire un instant et calculer les taux et les résultats des différents événements qui pourraient affecter les séquences. Ces événements comprennent la coalescence par reproduction, les transferts d'ADN et les mutations. Les mutations ont le même effet sur pour comme suit. Puisque deux paires de sites sont impliquées, le taux total de mutations est et l'opérateur linéaire des mutations agissant sur peut être écrit comme suit : (38) où

Équation de dynamique pour

Les événements possibles qui pourraient affecter à côté des mutations sont illustrés à la figure 6C. Les événements de coalescence se produisent à un rythme provoquant une identité sur les deux sites, et le vecteur d'état devient donc, pour les événements de transfert d'ADN, comme le montre la figure 6C, nous devons considérer (i) les transferts internes sur un site, (ii) les transferts externes sur un site , (iii) transferts internes à deux sites, et (iv) transfert externe à deux sites. (i) Un transfert interne à un site, qui se produit à un rythme, entraîne une coalescence sur un site, tout en laissant l'autre inchangé. Le vecteur d'état devient où est la probabilité que deux séquences diffèrent au niveau du site inchangé. Par conséquent, (ii) Un transfert externe à un seul site crée une configuration qui implique trois séquences différentes, et le vecteur d'état devient ainsi Cela se produit avec la vitesse puisque chaque site peut recevoir de l'ADN de l'un des les séquences ne faisant pas partie de la paire donnée. (iii) Un transfert interne à deux sites entraîne une identité sur les deux sites, c'est à dire., Enfin, (iv) le transfert externe à deux sites ne change pas le vecteur d'état, puisque les étiquettes de séquence sont échangeables. Multiplier les variations possibles par leurs taux donne

Équation de dynamique pour

Les événements possibles qui pourraient affecter sont illustrés à la figure 6D. La coalescence peut affecter la configuration de trois manières différentes : (i) les trois séquences pourraient fusionner simultanément, donnant une identité aux deux sites, donc, (ii) la séquence à deux sites , et l'une des deux séquences à site unique ou , pourrait fusionner, provoquant une identité sur un site et laissant l'autre site inchangé, le vecteur d'état devient et ou (iii) les deux séquences à site unique et pourrait fusionner sur une séquence ancestrale qui porte les deux sites, par conséquent, le vecteur d'état devient et Les taux de ces événements sont et respectivement.

Puisqu'un transfert interne implique le choix de deux séquences (l'une comme donneur et l'autre comme receveur), il existe deux types de transferts différents (Figure 6D) : ceux entre la séquence bisite et l'une des deux séquences monosite ou , et les autres entre les deux séquences monosite et . Les résultats de ces transferts sont exactement les mêmes que ceux de la fusion de deux séquences discutées ci-dessus (ii et iii, voir ci-dessus), de sorte qu'ils changent le vecteur d'état en et et se produisent avec les taux et respectivement. Un transfert externe à un site d'une séquence externe à l'une des deux séquences à site unique ne modifie que les étiquettes de séquence, mais pas la configuration, donc D'autre part, lorsqu'un transfert externe à un site se produit dans la séquence à deux sites , la configuration devient celle d'où, avec taux En multipliant les taux par les changements, on trouve

Équation de dynamique pour

Les événements possibles qui pourraient affecter sont illustrés à la figure 6E. Étant donné que quatre séquences sont impliquées, dont chacune ne porte qu'un seul site, quatre types différents d'événements de coalescence sont possibles : (i) la coalescence simultanée des quatre séquences, qui donnent une identité aux deux sites et (ii) la coalescence simultanée de trois séquences, produisant identité à l'un des deux sites d'où, (iii) la coalescence de deux séquences avec des sites au même locus, donnant une identité à l'un des deux sites d'où, et (iv) la coalescence de deux séquences avec deux sites différents, conduisant à un séquence qui porte les deux sites, le vecteur d'état devient alors et Les taux de ces événements sont et respectivement.

Pour un transfert d'ADN interne, les deux séquences choisies peuvent porter leur site unique soit au même locus, soit à des loci différents, et, par conséquent, il existe deux types de transferts d'ADN internes (figure 6E). Les résultats de ces deux types de transfert sur le vecteur d'état sont exactement les mêmes que pour la coalescence de deux séquences discutées dans les types (iii) et (iv) ci-dessus. Les taux sont et respectivement. Puisque dans la configuration de chacune des quatre séquences ne contient qu'un seul site et que les étiquettes de séquences sont échangeables, les transferts externes ne changent pas le vecteur d'état, en multipliant ces taux par des changements, on trouve

Solution exacte pour les valeurs en régime permanent de

En combinant ce qui précède, nous exprimons les équations comme un système d'équations différentielles linéaires couplées non homogènes : (43) dans lequel je est une matrice identité, et décrivent les transitions de et vers et respectivement, avec et et S est l'opérateur de reproduction et de transfert, qui a la forme suivante : (44) La forme tridiagonale de S conduit à une matrice tridiagonale par blocs du produit de Kronecker, qui peut s'écrire sous une forme générale (45) dans la matrice par blocs UNE, les blocs hors diagonale sont des matrices scalaires, et les blocs diagonaux sont des sommes de matrices scalaires et de l'opérateur de mutation, M, qui est diagonalisable. Surtout, UNE est une matrice bloc diagonalement dominante dans la norme induite par la -norme, qui garantit que UNE est non singulier (Feingold et Varga 1962). L'inverse de UNE peut être calculé efficacement en utilisant un algorithme donné par (Ran et Huang 2006), qui donne la solution à l'état stationnaire de l'équation 43. L'utilisation de la solution à l'état stationnaire pour les équations 27 à 33 et les équations 4 à 7 donne la solution exacte pour la corrélation fonctions et variations. Les solutions résultantes prédisent avec précision les résultats de la simulation pour le modèle de Moran et le modèle de Schweinsberg, comme le montre la figure 2. Étant donné que leur expression exacte est difficile à manier, nous recherchons une approximation qui donne une forme plus simple pour une analyse plus approfondie dans la section suivante.

E. Approximation du champ moyen et solutions

On note que les transferts externes à un seul site font les transitions entre un graphe cyclique (Figure 6F, flèches en pointillés), et compliquent ainsi les solutions des équations linéaires (Équations 40-42). Une approximation possible est donc de supprimer les transitions et et de les prendre en compte implicitement comme des mutations. Comme le montre la figure 7, un transfert externe implique trois séquences avec quatre structures généalogiques possibles. Après les transferts externes d'un site, les relations généalogiques des deux séquences en question vont changer (Figure 7), mais le temps de coalescence ne changera que dans deux des quatre structures généalogiques, ce qui arrive avec probabilité Si le temps de coalescence ne change pas [comme dans les cas (i) et (ii), Figure 7], l'échangeabilité implique qu'il n'y aura pas de changement dans la distribution de probabilité pour la paire de séquences en question. Si le temps de coalescence change [comme dans les cas (iii) et (iv), Figure 7], la distribution de probabilité change, et notre approximation du champ moyen suppose que les deux sites différeront alors avec la probabilité , c'est à dire., la distance moyenne par paire dans la population. En conséquence, l'opérateur pour ces transferts, peut être écrit comme (46) Nous pouvons combiner ces transferts externes d'un site et des mutations ponctuelles pour former un opérateur de mutation effectif, qui est pour ou pour Les transferts externes explicites d'un site apparaissant dans l'équation 43 sont supprimés et remplacés par l'opérateur de mutation approprié, ce qui donne les solutions simplifiées données ci-dessous.

Solution pour le modèle Moran

Nous trouvons les solutions dont nous utiliserons plus tard pour les solutions des fonctions de corrélation, dans l'approximation de champ moyen pour le modèle de Moran comme suit : (47) (48) (49) Étant donné cela et nous pouvons simplifier davantage les solutions : ( 50) (51) (52) En utilisant la solution de champ moyen ci-dessus pour et l'équation 34, nous obtenons la solution de champ moyen pour (53) De même, en utilisant la solution de champ moyen pour et l'équation 36, nous trouvons la solution pour ( 54) où

Pour utiliser les solutions pour et et l'équation 35, nous obtenons (55) Enfin, nous calculons la variance

Solution pour le modèle de Schweinsberg

Nous trouvons les solutions pour dans l'approximation de champ moyen pour le modèle de Schweinsberg comme suit : (57) (58) (59) pour

Compte tenu des solutions ci-dessus, on trouve (60) (61) (62) où

Approximation du champ moyen et théorie de la coalescence

Les résultats de champ moyen pour peuvent être obtenus de manière équivalente en utilisant la théorie coalescente, que nous illustrons ici pour le cas de Étant donné deux paires de sites sur une paire de séquences, un événement coalescent pourrait impliquer les deux paires avec taux où le dernier terme est le taux de coalescence dû aux transferts bi-site entre les deux séquences, donnant l'état ou il pourrait s'agir d'un seul des deux couples avec le taux qui est le taux de coalescence due aux transferts internes mono-site entre les deux séquences, donnant le état Le temps de coalescence t suit donc une distribution exponentielle avec taux Étant donné le temps de coalescence, on peut calculer en propageant vers l'avant dans le temps le processus de mutations et de transferts externes d'un site pendant un temps t à partir des deux états ancestraux, et Nous notons que les transferts externes à deux sites qui se produisent pendant ce temps impactent les deux sites, et sont donc équivalents à échanger l'une des séquences contre un individu différent de la population. Puisque nous étudions un coalescent échangeable, ces événements ne modifient pas la répartition des temps de coalescence, et n'ont donc pas d'impact sur le calcul. Nous définissons un opérateur mutationnel combiné qui inclut à la fois les mutations et les transferts externes à un seul site, et l'utilisons pour se propager dans le temps, tout en prenant l'espérance sur le temps de coalescence : (63) On peut vérifier qu'il s'agit de la même équation que la constante -équation d'état pour dans l'approximation du champ moyen (voir l'équation 40). Le calcul de l'inverse de la matrice et l'application à et donne donc la même expression pour donnée dans l'équation 47.

F. Formes analytiques pour l'inférence de paramètres dans les échantillons biaisés

On considère une paire d'individus avec un temps de coalescence On suppose que t est suffisamment courte pour que chaque paire de sites du génome séparés par une distance ait été affectée par au plus un événement de mutation ou de recombinaison. Pour les portions du génome qui n'ont pas été affectées par la recombinaison, la divergence moyenne par site de la paire de séquences est donnée par La probabilité qu'un seul site soit affecté par la recombinaison est Puisque le donneur est choisi au hasard parmi l'ensemble de la population de taille N, nous pouvons négliger les transferts entre la paire d'individus donnée, qui ont une probabilité Après un transfert, la divergence attendue dans la région recombinée est la diversité globale de la population, . En tenant compte des taux et des effets des événements de mutation et de recombinaison, nous calculons la diversité attendue de la paire de séquences comme (64) En rappelant que et où nous considérons N pour représenter la taille de la population globale avec laquelle les séquences peuvent se recombiner (par exemple., celui d'une espèce entière), nous pouvons supposer que puisque typiquement nous avons un moment est généralement de l'ordre d'un kilobase ou plus. Ces hypothèses sont ensuite testées pour l'auto-cohérence une fois l'ajustement effectué. Ainsi, on a donc ce qui permet d'approximer en ne considérant que la contribution de la recombinaison : (65) On considère maintenant le calcul de c'est à dire., la probabilité que des substitutions se soient produites sur les deux sites, où l'on distingue la valeur de la population, qui correspond à l'espérance pour deux séquences choisies au hasard dans l'ensemble de la population de taille N, et celui de l'échantillon, que nous désignons par et est calculé pour les paires d'individus au sein de l'échantillon donné. Depuis t est suffisamment courte, la probabilité que deux événements ou plus se produisent sur les deux sites en question est négligeable. Ainsi, le seul événement pouvant introduire des substitutions sur les deux sites sur l'échelle de temps t est un transfert à deux sites de la population globale dans l'échantillon, qui se produit avec probabilité Nous obtenons (66) et, en substituant l'expression pour les rendements (67) Nous définissons (68) et, étant donné que nous obtenons (69) Si la distance entre les sites je est plus petite que les tailles de fragments transférées typiques, nous avons et en utilisant lesquelles, nous trouvons

G. Application à l'analyse des séquences bactériennes

Nous avons obtenu une liste organisée de 185 E. coli isolats de séquence de type 131 (ST131) issus de deux études récentes (Price et al. 2013 Petit et al. 2014 Ben Zakour et al. 2016), et une liste totale de 1216 S. pneumoniae isolats, qui se composaient de tous les isolats des sept plus grands groupes dans une étude longitudinale sur le portage du pneumocoque (Chewapreecha et al. 2014).

Pour chaque espèce, nous avons appliqué une approche basée sur les références pour générer des alignements du génome entier à partir des données de lecture d'Illumina. Nous avons utilisé E. coli souche EC958 (code d'accession EMBL HG941718), et S. pneumoniae souche ATCC700669 (code d'accession EMBL FM211187), en tant que génomes de référence, et mappé des paires de lecture contre eux à l'aide de SMALT version 0.7.6 (https://sourceforge.net/projects/smalt/) avec les paramètres par défaut. L'alignement résultant a ensuite été traité avec Samtools (Li et al. 2009) et FreeBayes (Garrison et Marth 2012) pour générer une séquence consensus. Pour appeler des bases à chaque position, nous avions besoin d'au moins deux lectures dans chaque direction (c'est à dire., pour une profondeur de lecture minimale totale de quatre), et un consensus 75 % sur l'allèle principal. La qualité de base sur le site devait être 50, et la qualité cartographique devait être ≥30, sur l'échelle Phred. Lorsqu'une base appelée était un SNP, nous exigeions en outre qu'elle soit prise en charge par FreeBayes et Samtools avec des scores de qualité ≥30. Tous les autres sites qui n'ont pas réussi ces critères, ainsi que les insertions et les suppressions, ont été masqués en tant que lacunes. Enfin, pour chaque clade d'une espèce, les séquences consensus résultantes ont été combinées pour générer un alignement du génome entier.

Pour éviter toute ambiguïté dans l'attribution des distances le long du génome en raison du potentiel de réarrangement du génome, l'alignement du génome entier résultant a été divisé en plusieurs alignements de gènes, et chaque alignement de gènes a été divisé en plusieurs blocs d'alignement avec une longueur fixe de 300 pb. Dans chaque bloc, nous avons supprimé les séquences dans lesquelles les espaces constituaient >2% de la longueur totale. Après avoir filtré de telles séquences, nous avons en outre exclu les blocs d'alignement constitués de moins de cinq séquences. En utilisant les blocs d'alignement filtrés, nous avons comparé les séquences d'ADN par paires. Pour chaque paire de séquences k, nous avons obtenu un profil de substitution à la troisième base de chaque codon. Pour réduire l'impact de la sélection, nous avons masqué les positions contenant des substitutions non synonymes et ne les avons pas utilisées dans l'analyse, mais avons conservé leurs coordonnées génomiques afin que les distances physiques restent inchangées.

À l'aide des profils de substitution, nous avons calculé la diversité de l'échantillon et les fonctions de corrélation. Pour prédire, nous avons utilisé les relations dans les équations 34-36 avec la forme ajustée de et utilisé où q a été déterminé par la structure coalescente de l'échantillon (par exemple., pour les statistiques BSC). Lors du montage q (lignes bleues et vertes en pointillés sur la figure 5), nous avons effectué une régression linéaire en utilisant la relation avec la forme ajustée et les valeurs mesurées de

Nous notons qu'en principe, on pourrait déduire la distribution complète des tailles de fragments transférés en utilisant la fonction de corrélation de structure.On peut inverser l'équation 12 pour obtenir en termes de et, en différenciant, obtenir En pratique, cependant, mesurer avec précision la courbure de la décroissance de la corrélation nécessiterait une très grande quantité de données, que nous avons trouvées bien au-delà des tailles des ensembles de données disponibles (données non présentées). Néanmoins, comme nous l'avons discuté ci-dessus, la taille moyenne des fragments peut être efficacement déduite en utilisant les données actuellement disponibles.

H. Barrières à la recombinaison et structure de la population

Dans l'analyse et les simulations ci-dessus, le processus de transfert n'était pas contraint, de sorte que chaque génome peut se recombiner avec n'importe quelle autre séquence au sein de la population avec un taux égal. En réalité, cependant, il existe des barrières qui empêchent le libre échange génétique entre les individus au sein d'une population bactérienne. Par exemple, le système de réparation des mésappariements inhibe la recombinaison interspécifique et réduit les fréquences de recombinaison parmi les individus éloignés (Fraser et al. 2007). De plus, la voie classique pour la recombinaison homologue implique la reconnaissance d'homologie médiée par RecA entre les séquences du donneur et du receveur (Kuzminov 1999). Chez plusieurs espèces bactériennes, des études en laboratoire ont trouvé une relation log-linéaire entre la divergence de séquence et la fréquence de recombinaison (Fraser et al. 2007).

Barrières de recombinaison en simulation

Pour évaluer l'ampleur des barrières de recombinaison sur notre estimation des taux de transfert, nous avons modifié nos simulations comme suit. Après avoir choisi au hasard une paire k des génomes pour la recombinaison, nous calculons leur distance par paire, et nous permettons à la recombinaison de se produire avec probabilité où b est la force de la barrière de recombinaison qui réduit l'efficacité du transfert. Au cours des simulations, nous enregistrons le nombre total d'événements de transfert réussis dans la population. Ce processus limite la recombinaison parmi les individus éloignés et réduit ainsi le taux global de transferts réussis au sein de la population (Figure 8).

Nous avons comparé les taux globaux de transferts réussis, mesurés directement à partir de simulations, avec nos estimations basées sur l'approximation du champ moyen. En raison de la barrière de recombinaison et de son effet sur les fonctions de corrélation, l'inférence des taux de transfert basée sur l'ajustement des mesures de la population globale sous-estimera les taux de transferts réussis par un facteur d'une fonction croissante du produit de la diversité de la population et de la recombinaison barrière (Figure 8 et voir dérivation ci-dessous). Ainsi, un écart significatif de notre estimation nécessite à la fois une grande diversité de population et une grande barrière de recombinaison, et on peut corriger les estimations si la valeur de b est connu pour une espèce donnée. Cependant, notre procédure d'inférence pour l'ajustement des échantillons génomiques (annexe F) tient compte implicitement de l'efficacité du transfert dans la façon dont elle modélise la diversité des échantillons, ce qui évite d'avoir à mesurer et corriger explicitement les barrières de recombinaison dans différents ensembles de données.

Taux de transferts réussis dans la population

Ici, nous calculons le taux moyen de transferts réussis, compte tenu du taux de tentatives de transferts, ??. Pour toute séquence X, les transferts se produisent à partir des séquences donneuses, D, dont le temps de coalescence avec X est une variable aléatoire, t, qui est distribué de façon exponentielle avec le taux La divergence moyenne entre la séquence X et D est alors donnée par et la probabilité que le transfert réussisse est donc intégratrice sur t donne le taux moyen de transferts réussis, (71) où mesure la résistance effective de la barrière de recombinaison.

L'impact de l'efficacité de transfert sur l'approximation du champ moyen

Comme détaillé dans l'annexe E, nous avons obtenu l'approximation de champ moyen en étudiant la distribution d'arbres phylogénétiques possibles impliqués dans un transfert externe d'un site (Figure 7). Une barrière de recombinaison modifie cette distribution - les transferts sont plus susceptibles de se produire entre des séquences étroitement liées plutôt qu'entre des séquences distantes. Il surpondère ainsi les deux premiers types d'arbres illustrés à la figure 7, et sous-pondère les deux derniers arbres, ce qui modifie la valeur de w, et conduit à une sous-estimation du taux de transferts réussis.

Pour corriger ce biais, nous étudions l'effet de l'efficacité du transfert sur les deux derniers arbres de la figure 7. Nous considérons une paire de séquences, X et Y, et un transfert externe à un site d'une séquence donneuse D vers X. Lorsque nous traçons les trois lignées en arrière dans le temps, il existe deux fusions séquentielles entre elles, et nous laissons et désignons les temps de coalescence des première et deuxième fusions, respectivement. Nous calculons la probabilité d'observer l'arbre (iii) avec des valeurs spécifiées de et La première fusion se produit entre les branches D et Y, alors que toutes les autres fusions possibles (DX, XY ou DXY) ne se produisent pas la probabilité associée est donc Après la première fusion, il reste du temps jusqu'à la deuxième fusion, au cours de laquelle l'échantillon contient deux lignées donc, la probabilité associée est Multiplier les deux probabilités, et en utilisant l'identité la probabilité d'observer l'arbre donné est (72) Puisque les deux arbres (iii) et (iv) ont la même topologie, leur probabilité est la même. Dans les deux cas, la divergence entre D et X, qui est donnée par détermine l'efficacité du transfert. On peut donc calculer la valeur de w, qui est la probabilité d'observer des transferts d'un site sous forme d'arbres (iii) et (iv), en intégrant sur les temps de coalescence : (73) (74) Sans barrière de recombinaison (c'est à dire., ), nous obtenons la probabilité d'origine.c'est à dire., en utilisant ) donnerait donc une valeur qui peut être écrite comme indiquant que nous sous-estimerions le taux de transferts réussis, d'un facteur.

Illustration des transitions possibles entre configurations pour un ou deux couples de sites. Chaque ligne horizontale représente une séquence unique et les petites lignes verticales représentent des sites. (A) montre les transitions et événements possibles pour une paire de sites. Lorsque la paire devient identique en raison d'une transition indiquée, nous désignons le site par une étoile. (B) montre différentes configurations de deux paires de sites, et les états de coalescence dans un ou les deux sites, et leurs transitions et événements possibles sont montrés dans (C-E). Les transitions entre les configurations sont résumées en (F), où les flèches pleines représentent les transitions dues à la reproduction, au transfert interne à un site ou au transfert à deux sites, et les flèches en pointillé correspondent à un transfert externe à un site dans une séquence avec deux sites.

Illustration des transferts externes d'un site et de leurs impacts sur les éventuels arbres généalogiques. Dans chaque arbre, X et Y sont la paire de séquences à l'étude, et D est la séquence donneuse du transfert externe représentée par une flèche de D à X. Un cercle rouge représente le MRCA de X et Y avant le transfert, et un l'étoile rouge désigne le MRCA après le transfert.

Barrière de recombinaison et taux de transferts réussis. Le graphique montre le taux de population de transferts réussis, en fonction de b, qui contrôle l'efficacité du transfert de telle sorte qu'un b correspond à une barrière de recombinaison plus importante. La prédiction théorique est représentée en traits pleins. Les résultats de la simulation sont affichés pour les taux mesurés (cercles vides) et les taux inférés basés sur l'ajustement des corrélations mutationnelles (triangles pleins). Les cercles pleins sont les taux inférés corrigés par le facteur d'échelle, l'Encart montre les données s'effondrant sur la prédiction théorique lorsqu'elles sont tracées en fonction des paramètres de simulation utilisés et avec différentes valeurs de b et ?? comme indiqué. Chaque point de données correspond à une moyenne de plus de 10 000 simulations, qui ont été exécutées sur un temps total beaucoup plus long que le temps de coalescence. L'ajustement des corrélations mutationnelles a été effectué en utilisant le résultat du champ moyen pour l'équation 10.


Recombinaison Génétique (Avec Diagramme) | Biologie moléculaire

Faisons une étude approfondie de la recombinaison génétique. Après avoir lu cet article, vous découvrirez : 1. Recombinaison bactérienne 2. Holliday Junction Modèle 3. Deux jonctions Holliday 4. Enzymes de recombinaison homologue et 5. Rôle de la protéine Rec A dans la recombinaison génétique homologue.

Introduction à la recombinaison génétique :

La recombinaison de l'ADN a lieu par mutation, échange de brins d'ADN et incorporation d'ADN. Dans ce processus, l'information génétique est réarrangée entre les chromosomes qui possèdent des séquences similaires. La recombinaison génétique homologue se produit chez les eucaryotes au moment de la formation des gamètes pendant la longue prophase I de la méiose.

Chaque chromosome a deux chromatides sœurs, chacune contenant un ADN duplex. Les chromosomes homologues (un maternel et l'autre paternel) s'apparient, l'appariement est connu sous le nom de synapsis et implique toute la longueur des chromosomes homologues.

La recombinaison se produit par croisement. Il implique un échange réciproque de segments chromosomiques entre des chromatides non sœurs d'une paire homologue impliquant une rupture et une réunion ultérieure dans un nouvel arrangement. Le chiasma se forme sur le site de traversée. Des enzymes comme les hélicases, les endonucléases et les ligases sont impliquées.

La recombinaison génétique provoque un réarrangement des gènes produisant de nouveaux génotypes et phénotypes. Celles-ci provoquent des variations qui conduisent à l'évolution. Chez l'homme, environ 30 événements de recombinaison homologue se produisent au cours de chaque méiose. Les événements de recombinaison sont beaucoup plus chez les bactéries et encore plus chez les champignons.

L'étude de la méiose chez les plantes de lys par Herbert Stern et Yasuo Hotta a fourni des preuves irréfutables de la recombinaison. Les méiocytes des boutons floraux de lys se divisent de manière synchrone. Il a également été découvert que l'endonucléase, l'ADN polymérase, la ligase et d'autres enzymes de réparation sont présentes au début de la prophase.

La mécanique des échanges au niveau moléculaire est étudiée en détail chez les bactéries et les phages. À présent, nous limiterons notre discussion au mécanisme de recombinaison où les brins d'ADN se reconnaissent par des brins complémentaires délimités par des paires de bases. Chez les bactéries, la recombinaison génétique se produit pendant la conjugaison, la transformation, la transduction, la réparation post-réplication, pendant la réparation des cassures double brin dans l'ADN, l'intégration de l'ADN phagique avec l'ADN chromosomique et les transposons, etc. La recombinaison homologue peut conduire à la conversion génique.

Recombinaison bactérienne :

Les bactéries sont haploïdes et ne subissent donc pas de méiose. Ils ne possèdent qu'une seule molécule d'ADN double brin ou chromosome. Il existe plusieurs types de recombinaison génétique chez les micro-organismes. La recombinaison la plus courante est l'échange réciproque entre des séquences d'ADN homologues.

Au cours de la recombinaison génétique, généralement, seule une partie du matériel génétique d'une cellule donneuse est transférée à une cellule receveuse. L'ADN de la cellule receveuse et celui du donneur s'apparient et échangent réciproquement des brins d'ADN en se croisant. Cela donne lieu à une nouvelle constitution génétique de la cellule receveuse avec de nouveaux caractères. Cellules filles suivantes qui ne contiennent que des chromosomes recombinés.

Il existe les méthodes principales suivantes par lesquelles la recombinaison du matériel génétique a lieu dans les bactéries.

1. Recombinaison homologue :

L'ADN de la cellule donneuse se recombine avec l'ADN receveur par échange réciproque de brins d'ADN. Les molécules d'ADN recombinantes ont des séquences homologues. Les molécules d'ADN s'alignent ou s'apparient et subissent un croisement et une recombinaison homologue. L'ADN recombinant a une nouvelle constitution génétique.

Les bactéries peuvent acquérir l'ADN d'autres espèces bactériennes étroitement apparentées et peuvent se transformer. C'est ce qu'on appelle la transformation. La transformation a été démontrée pour la première fois par Griffith dans des bactéries Diploccous pneumoniae pour confirmer l'ADN en tant que matériel génétique. La recombinaison homologue est catalysée par la protéine rec A.

2. Recombinaison non homologue :

La recombinaison entre des segments d'ADN qui n'ont pas de régions homologues est également assez fréquente. Ici, l'ajout ou l'insertion d'une petite séquence d'ADN dans un ADN receveur a lieu. Elle se produit principalement par saut de gènes ou de transposons. Ces séquences d'ADN mobiles sautent régulièrement vers un nouvel emplacement n'importe où sur le génome. Souvent, les éléments transposables se répliquent pour générer deux copies. Une copie reste sur le site d'origine tandis que l'autre saute sur le site cible.

3. Recombinaison spécifique au site :

Lorsque le phage (lambda) infecte la bactérie E. coli, l'ADN du phage est inséré dans l'ADN de la bactérie. De cette manière, l'ADN du phage s'intègre dans l'ADN de l'hôte et devient une partie du chromosome de l'hôte. La bactérie contenant un ensemble complet d'ADN phagique est appelée lysogène. L'ADN phagique est inséré à un site spécifique dans l'ADN hôte.

Le site de fixation des deux ADN possède une séquence identique de 15 paires de bases. Une protéine codée par un phage appelée intégrase catalyse l'intégration. Une protéine hôte appelée facteur d'intégration hôte (IGF) est également impliquée. L'intégrase est une enzyme topoisomérase qui casse, tourne puis rejoint les brins des deux molécules. Chez les eucaryotes, la recombinaison spécifique au site produit une diversité d'anticorps.

Modèle Holliday Junction :

Divers modèles pour expliquer la recombinaison génétique homologue ont été proposés sur la base principalement de l'observation génétique chez les bactéries et les champignons. On sait maintenant qu'une certaine quantité de synthèse d'ADN a également lieu pendant la recombinaison. Les enzymes de réplication et de réparation de l'ADN sont présentes au moment de la recombinaison génétique.

En 1964, Robin Holliday a proposé un modèle pour expliquer le processus moléculaire impliqué lors de l'échange d'ADN entre deux molécules d'ADN double brin homologues.

Les étapes clés de ce modèle sont les suivantes :

Tout d'abord, l'appariement ou l'alignement ou la synapsis entre deux duplex d'ADN homologues a lieu. Leurs séquences sont parfaitement identiques sauf qu'elles peuvent contenir de petites régions de gènes différents appelés allèles.

Ensuite, des cassures ou des coupures se produisent à des sites identiques dans un brin d'ADN des deux duplex d'ADN homologues précisément au même point. Les extrémités cassées des brins envahissent alors les brins complémentaires opposés créant de courtes régions hétéroduplex (à cause des allèles différents). Ce processus est appelé invasion de brins. Cette structure de croisement formée est appelée jonction de vacances.

La jonction Holliday se déplace dans le sens latéral. Au cours de ce processus, un brin d'ADN est progressivement échangé avec un brin d'ADN de l'autre hélice. Cette migration latérale de la jonction Holliday est appelée migration de branche. Les paires de bases d'origine sont rompues dans les molécules parentales et de nouvelles paires de bases sont formées dans les brins recombinés.

Si les deux moelcuels ont des allèles alternés, A/a, B/b et C/c alors l'échange de brins d'ADN lors de la migration des branches produit des régions double brin qui ne sont pas identiques. Ces régions dépareillées sont appelées hétéroduplexes. Au cours de la migration des branches, la région hétéroduplex est allongée.

La rupture et la réunion ultérieure conduisent à la formation de cette molécule commune composée de quatre brins d'ADN imbriqués.

La caractéristique clé de la jonction Holliday est le clivage ou la coupure à travers le point de croisement qui résout ou sépare les molécules recombinées. Pour exposer deux sites coupés, la jonction Holliday est tournée de 180° pour former une structure plane carrée. La résolution de la jonction Holliday se produit en coupant les brins d'ADN au site de croisement et en les rejoignant.

La résolution s'effectue de l'une des deux manières. Cela donne lieu à deux classes de produits d'ADN. Le site coupé 1 clive les deux brins qui étaient initialement cassés au début du processus de recombinaison (les brins envahissants sont coupés). La résolution produit deux molécules non recombinantes car seul l'échange d'allèles a eu lieu dans la région médiane du duplex B/b et b/B. Ainsi, un patch d'ADN hybride est formé. Ces molécules sont appelées produits de patch.

Le site coupé 2 se clive (les brins non envahissants sont coupés) et rejoint deux duplex de telle sorte que les gènes flanquants ou périphériques sont échangés. Ici, l'ADN est réciproquement recombiné. Le croisement se produit entre les gènes A et C.

Recombinaison d'échange à brin unique :

Selon Mesclson et Radding, une cassure simple brin dans l'une des deux molécules d'ADN homologues est assez courante.

L'extrémité libre du brin cassé envahit la double hélice ininterrompue et déplace un brin. La protéine Rec A a la capacité de retirer un seul brin et de le déplacer. Exonuplease dégrade la boucle d'ADN simple brin déplacée. Le brin ininterrompu de la première molécule sert de modèle pour synthétiser le nouveau brin.

Deux carrefours de vacances :

Des cassures double brin dans les deux brins d'une molécule d'ADN se produisent assez fréquemment. Au cours de la réparation de l'ADN des cassures double brin, une recombinaison homologue se produit. Ce type de recombinaison génétique est appelé mécanisme de réparation des cassures double brin. Ces types de ruptures peuvent être causés par des rayonnements ionisants et divers agents nocifs.

Dégénérescence des brins cassés et génération de queues simples (ss tails) avec 3 tendances.

Les enzymes Rec BCD dégradent davantage les brins d'ADN brisés. Il génère des queues simple brin avec 3 & 8242 extrémités. Une queue à 3 extrémité envahit l'autre molécule d'ADN homologue ininterrompue, déplaçant l'un des brins. L'extrémité envahissante 3′ sert d'amorce pour la nouvelle synthèse d'ADN. Le brin déplacé sert de matrice pour combler le vide laissé dans le premier ADN. Si différents allèles sont présents sur le site de rupture, ils sont définitivement perdus car la régénération implique un ADN homologue comme matrice qui a des allèles différents. Ce processus est appelé conversion génique car les gènes du brin cassé sont remplacés par des gènes de l'ADN homologue.

Dans la réparation de cassure double brin, deux jonctions Holliday sont créées. Ces jonctions Holliday se déplacent latéralement par migration de branche et le clivage se résout et sépare les deux molécules d'ADN formant une structure croisée et non croisée. Ceci est similaire à la résolution dans la seule jonction Holliday.

Enzymes de recombinaison homologue :

Il existe diverses protéines qui catalysent diverses étapes du processus de recombinaison dans E. coli.

Les enzymes Rec BCD se chargent sur une extrémité de l'ADN de la rupture double brin et se déplacent le long de l'ADN. (Re-recombinaison). Dans le processus, il déroule l'ADN (activité hélicoïdale) et dégrade un ou les deux brins d'ADN (activité nucléase). Rec BCD est une enzyme endonucléase.

Il est codé par trois gènes, Rec B, Rec C et Rec D. Rec BCD poursuit son activité de dégradation jusqu'à ce qu'il atteigne un site chi (%). À ce stade, les activités de Rec BCD sont arrêtées. Le site chi a huit nucléotides. 5′ GCTGGTGGG 3′. Les sites chi favorisent la recombinaison.

Les queues d'ADN simple brin générées par les enzymes BCD sont recouvertes par l'enzyme Rec A. Rec A stimule l'appariement ou le synopsis entre deux molécules d'ADN homologues. Rec A favorise également l'invasion de brins, déplaçant un brin de molécule d'ADN ininterrompue et formant une boucle D. Le brin déplacé envahit la molécule d'ADN brisée. Les portions manquantes des brins d'ADN sont synthétisées en utilisant un brin homologue comme matrice et les espaces sont scellés par l'enzyme ligase.

Les enzymes Ruv AB reconnaissent et se lient à la jonction Holliday et effectuent la migration des branches. L'enzyme Ruv C coupe les brins d'ADN à la jonction Holliday et provoque la séparation et la résolution de la jonction Holliday.

Différents processus biologiques tels que la réplication, la recombinaison et la réparation se produisent de manière coordonnée. De cette manière, un nouvel ADN peut être synthétisé, l'ADN endommagé peut être réparé et une recombinaison génétique a lieu. Les séquences nucléotidiques peuvent être remplacées par hétéroduplex et conversion génique.

Rôle de la protéine Rec A dans la recombinaison génétique homologue :

Dans les divers modèles de recombinaison génétique homologues, les caractéristiques centrales sont similaires dans tous les modèles de recombinaison.

Il s'agit notamment de cassures ou d'entailles dans les molécules d'ADN. Alignement ou appariement ou synapsis de séquences homologues de deux molécules d'ADN différentes. Formation d'une structure croisée ou d'une jonction Holliday dans laquelle le brin d'ADN de chaque molécule crée de courtes régions d'ADN hétéroduplux. Extension de l'ADN hétéroduplex, appelée migration ramifiée Enfin, résolution de la jonction croisée pour donner des produits finaux.

Il s'agit d'un processus extrêmement complexe impliquant l'action de plusieurs enzymes différentes. Le premier événement de création de cassures ou de micks dans les brins d'ADN et le dernier événement de résolution sont entrepris par diverses enzymes telles que l'hélicase, la nucléase et les ligases.

Mais l'événement à partir de l'appariement des molécules d'ADN, la formation de la migration de branche de jonction Holliday sont les caractéristiques centrales du processus de recombinaison. Ces événements sont entrepris par une protéine spéciale appelée protéine Rec A. La protéine Rec A est impliquée dans l'appariement, l'échange de brins et la migration des branches. Elle est également connue sous le nom de protéine d'échange de brins.

La protéine Rec A joue un rôle majeur dans la recombinaison homologue. C'est une protéine spéciale, une classe d'enzymes complètement distincte.

La protéine Rec A se lie rapidement à l'ADN simple brin le long du squelette phosphate de l'hélice d'ADN. L'ADN est entièrement recouvert par la protéine Rec A. Parallèlement à rec A, une seconde protéine appelée protéine de liaison simple brin (protéine SSB) est également impliquée. Chaque molécule Rec A contient 352 acides aminés. Il y a un monomère rec A tous les 3-4 nucléotides d'ADN.

Ensuite, l'ADNsb en duplex est aligné avec la séquence homologue de l'autre molécule d'ADN. Plusieurs étapes se produisent dans ce processus. Deux types d'interactions homologues se produisent. Le premier est la formation d'articulations paranémiques en brins homologues alignés. La deuxième interaction finale implique la formation d'articulations platonémiques.

La protéine Rec A est une ATPase dépendante de l'ADN. L'hydrolyse de l'ATP est requise pour la migration des branches, dans laquelle les brins sont remplacés et l'échange de brins se produit. Il présente une polarité lorsque la migration des branches se déroule dans la direction 5′ -> 3′ uniquement.

Échange de brins d'ADN :

Le rôle de l'échange de brins dans la réparation post-réplication est très important chez E. Coli. L'échange de brins joue un rôle très important dans la réparation des dommages à l'ADN. Lorsque la fourche de réplication avançante rencontre une lésion ou un site endommagé tel que des dimères de thymine, elle est contournée pendant le processus de réplication. La protéine endommagée peut être clivée, ce qui peut s'avérer mortel.

La réparation de cette lésion nécessite la conversion de cet ADN en ADN double brin et ceci est réalisé par la protéine rec A. La protéine Rec A joue son rôle dans la récupération d'une partie du brin complémentaire de l'autre côté de la fourche de réplication pour combler le vide. Cela implique une migration de branche par la protéine Rec A. Cela prouve que la migration des branches est une activité essentielle de la cellule.


Conclusion

Au carrefour de la réparation de l'ADN et de la réplication de l'ADN, la RH constitue une voie clé pour maintenir la stabilité génomique. HR prend en charge la réplication de l'ADN et facilite le redémarrage de la réplication après un blocage ou une rupture de la fourche. La réplication de l'ADN offre à son tour le processus idéal de reconnaissance des dommages, en vérifiant l'ensemble du génome, base par base, à la recherche de lésions qui interfèrent non seulement avec la réplication, mais également avec d'autres fonctions de l'ADN telles que la transcription. La protéine suppressive de tumeur humaine BRCA2 met en évidence le lien entre la RH et la prédisposition au cancer, et il est probable que des mutations dans d'autres protéines RH influenceront le risque de cancer. BRCA2 incarne également l'intersection entre HR et FA, mais les mécanismes impliqués dans la réparation de l'ICL et les contributions spécifiques de BRCA2 et de l'autre AFPN les gènes de ce processus restent à élucider. Dans le passé, les voies de réparation de l'ADN étaient soigneusement séparées sur la base de critères génétiques et biochimiques. Maintenant, il est devenu évident que de nombreux processus métaboliques de l'ADN sont étroitement liés. L'une des conséquences de cette intégration fonctionnelle entre la réplication de l'ADN et les différentes voies de réparation/tolérance des dommages à l'ADN est la complexité supplémentaire apportée par les décisions réglementaires régissant le traitement d'une lésion spécifique. Par conséquent, outre la nécessité d'élucider le processus de RH dans le support des fourches de réparation et de réplication, une plus grande attention se concentrera à l'avenir sur ces mécanismes de régulation.


Applications technologiques

Ciblage génétique

De nombreuses méthodes d'introduction de séquences d'ADN dans des organismes pour créer de l'ADN recombinant et des organismes génétiquement modifiés utilisent le processus de recombinaison homologue. 𖏢] Également appelée ciblage génique, cette méthode est particulièrement courante dans la génétique des levures et des souris. La méthode de ciblage génique chez les souris knock-out utilise des cellules souches embryonnaires de souris pour délivrer du matériel génétique artificiel (principalement d'intérêt thérapeutique), qui réprime le gène cible de la souris par le principe de la recombinaison homologue. La souris agit ainsi comme un modèle de travail pour comprendre les effets d'un gène mammifère spécifique. En reconnaissance de leur découverte de la façon dont la recombinaison homologue peut être utilisée pour introduire des modifications génétiques chez la souris par le biais de cellules souches embryonnaires, Mario Capecchi, Martin Evans et Oliver Smithies ont reçu le prix Nobel 2007 de physiologie ou médecine. 𖏣]

Les progrès des technologies de ciblage génique qui détournent la mécanique de recombinaison homologue des cellules conduisent maintenant au développement d'une nouvelle vague de modèles de maladies humaines isogéniques plus précis. On pense que ces modèles de cellules humaines modifiés reflètent plus précisément la génétique des maladies humaines que leurs prédécesseurs modèles murins. C'est en grande partie parce que les mutations d'intérêt sont introduites dans les gènes endogènes, tout comme elles se produisent chez les vrais patients, et parce qu'elles sont basées sur des génomes humains plutôt que sur des génomes de rat. De plus, certaines technologies permettent le knock-in d'une mutation particulière plutôt que de simples knock-outs associés aux anciennes technologies de ciblage génique.

Ingénierie des protéines

L'ingénierie des protéines avec recombinaison homologue développe des protéines chimériques en échangeant des fragments entre deux protéines parentales. Ces techniques exploitent le fait que la recombinaison peut introduire un degré élevé de diversité de séquences tout en préservant la capacité d'une protéine à se replier dans sa structure tertiaire, ou forme tridimensionnelle. Cela contraste avec d'autres techniques d'ingénierie des protéines, comme la mutagenèse ponctuelle aléatoire, dans lesquelles la probabilité de maintenir la fonction des protéines diminue de manière exponentielle avec l'augmentation des substitutions d'acides aminés. Les chimères produites par les techniques de recombinaison sont capables de maintenir leur capacité à se replier car leurs fragments parentaux échangés sont structurellement et évolutivement conservés. Ces "blocs de construction" recombinables préservent les interactions structurellement importantes comme les points de contact physique entre différents acides aminés dans la structure de la protéine. Des méthodes de calcul telles que SCHEMA et l'analyse de couplage statistique peuvent être utilisées pour identifier des sous-unités structurelles adaptées à la recombinaison. 𖏦] 𖏧] 𖏨]

Des techniques qui reposent sur la recombinaison homologue ont été utilisées pour concevoir de nouvelles protéines. Dans une étude publiée en 2007, les chercheurs ont pu créer des chimères de deux enzymes impliquées dans la biosynthèse des isoprénoïdes, une classe diversifiée de composés comprenant des hormones, des pigments visuels et certaines phéromones. Les protéines chimériques ont acquis la capacité de catalyser une réaction essentielle dans la biosynthèse des isoprénoïdes - l'une des voies de biosynthèse les plus diverses trouvées dans la nature - qui était absente des protéines mères. L'ingénierie des protéines par recombinaison a également produit des enzymes chimériques avec une nouvelle fonction chez les membres d'un groupe de protéines connu sous le nom de famille du cytochrome P450, qui chez l'homme est impliqué dans la détoxification des composés étrangers comme les médicaments, les additifs alimentaires et conservateurs. ⎡]

Traitement du cancer

Les cellules cancéreuses avec des mutations BRCA ont des déficiences dans la recombinaison homologue, et des médicaments pour exploiter ces déficiences ont été développés et utilisés avec succès dans des essais cliniques. L'olaparib, un inhibiteur de PARP1, a réduit ou arrêté la croissance des tumeurs des cancers du sein, de l'ovaire et de la prostate causées par des mutations des gènes BRCA1 ou BRCA2, qui sont nécessaires à la RH. Lorsque BRCA1 ou BRCA2 est absent, d'autres types de mécanismes de réparation de l'ADN doivent compenser la déficience de HR, comme la réparation par excision de base (BER) pour les fourches de réplication bloquées ou la jonction d'extrémités non homologues (NHEJ) pour les cassures double brin. En inhibant le BER dans une cellule déficiente en RH, l'olaparib applique le concept de létalité synthétique pour cibler spécifiquement les cellules cancéreuses. Alors que les inhibiteurs de PARP1 représentent une nouvelle approche de la thérapie anticancéreuse, les chercheurs ont averti qu'ils pourraient s'avérer insuffisants pour traiter les cancers métastatiques à un stade avancé. Les cellules cancéreuses peuvent devenir résistantes à un inhibiteur de PARP1 si elles subissent des délétions de mutations dans BRCA2, ce qui compromet la létalité synthétique du médicament en restaurant la capacité des cellules cancéreuses à réparer l'ADN par HR. 𖏭]


Résumé 3542 : Fréquence des mutations géniques homologues liées à la recombinaison dans le cancer du sein et leur corrélation avec le fardeau des mutations tumorales

Le cancer du sein est la tumeur maligne la plus courante chez les femmes dans le monde et des progrès thérapeutiques importants ont été réalisés au cours de la dernière décennie. L'identification de nouveaux biomarqueurs dans le cancer du sein est urgente pour stratifier les populations susceptibles de bénéficier de nouvelles thérapies personnalisées. Des défauts dans la voie de réparation des dommages à l'ADN par recombinaison homologue (HR-DDR) sensibilisent les tumeurs aux thérapies qui ciblent cette voie, telles que les inhibiteurs (PARP). Le but de notre étude était de déterminer la prévalence des mutations pathogènes HR-DDR et leur corrélation avec le fardeau des mutations tumorales (TMB).

Des échantillons de sang fixés au formol, inclus en paraffine (FFPE) et appariés de 328 patientes chinoises atteintes d'un cancer du sein ont été collectés pour un essai de panel ciblé de séquençage de nouvelle génération (NGS) de 450 gènes du cancer. Les altérations génomiques (AG), y compris la substitution de base unique, les insertions/suppressions courtes et longues, les variations du nombre de copies, les fusions et réarrangements de gènes, et les valeurs TMB ont été évaluées avec une couverture moyenne de 1000X. Échantillons avec au moins 1 GA dans les gènes de la voie HR (ARID1A, AU M, ATR, ATRX, AURKA, BAP1, BARDE1, BLM, BRCA1/2, BRIP1, CHEK1/2, FANCA/C/D2/E/F/g/L/M, MRE11A, NBN, PALB2, RAD50/1/1B/1C/1D/2, RAD54B/L, ou WRN) ont été identifiés comme déficients en HR-DDR (HRD).

Notre cohorte comprenait 326 femmes et 2 hommes avec un âge médian de 49 ans. Les sous-types moléculaires comprenaient HR+ (49 %, n=161), HER-2+ (32,6 %, n=107) et le cancer du sein triple négatif (TNBC) (18,2 %, n=60). Des mutations HR-DDR ont été détectées chez 38,1 % (125/328) des patients, et plus d'une mutation a été trouvée chez 23 patients. Les gènes les plus fréquemment mutés sont inclus BRCA2 (7.31%), ARID1A (6.4%), BRCA1 (5.48%), AURKA (2,4%) et RAD50 (2,1%). Aucune mutation n'a été identifiée dans les gènes de CHEK1, FANCE/F/G/L, MRE11A, RAD51/1B/1D, ou RAD54L. Les variations du DRH étaient enrichies dans 47,3 % des cas de stade IV, et seulement dans 13,6 % des cas à des stades plus précoces (p<0,01). Les mutations HRD n'étaient pas significativement associées aux sous-types moléculaires, y compris HR+ (38,5 %, n=62), HER-2+ (37,4 %, n=40) et TNBC (38,3 %, n=23). Les cas HRD avaient une TMB médiane plus élevée que les cas non HRD (5,4 vs 3 muts/Mo, respectivement, P <0,01). Des mutations germinales liées à HRD ont été trouvées chez 11,9% (39/328) des patients, et les patients HR+ semblaient héberger davantage de mutations germinales liées à HRD. BRCA1/2 Les mutations étaient les mutations germinales les plus fréquentes (BRCA1, n=8 BRCA2, n=13). Un patient avait 2 mutations germinales (BRCA2/FANCA).

Notre étude a révélé que des mutations HR-DDR se sont produites chez 38,1 % des patientes chinoises atteintes d'un cancer du sein, et BRCA2 était le gène le plus souvent muté. Les mutations HR-DDR étaient associées à une valeur TMB plus élevée, indiquant une stratégie potentielle d'immunothérapie chez les patientes chinoises atteintes d'un cancer du sein. Le rôle des thérapies dirigées par HRD, y compris les inhibiteurs de la poly-ADP ribose polymérase et les agents plus récents tels que les inhibiteurs de l'ATR, doit être exploré.

Format de citation : Haitao Lan, Qing Bu, Li Zhuang, Shuang Ren, Xuexin Yan, Ye Li, Qian Yu, Xiaoliang Shi, Juan Zhao, Honglin Guo, Liang Zhao. Fréquence des mutations géniques homologues liées à la recombinaison dans le cancer du sein et leur corrélation avec le fardeau des mutations tumorales [résumé]. Dans : Actes de la réunion annuelle de l'American Association for Cancer Research 2020 2020 27-28 avril et 22-24 juin. Philadelphie (PA): AACR Cancer Res 202080(16 Suppl):Abstract nr 3542.


Conclusion

Il est clair que la connaissance du statut de mutation germinale et somatique devient de plus en plus importante dans la prise en charge des patientes atteintes d'un cancer de l'ovaire. L'expérience avec les inhibiteurs de PARP dans les essais cliniques sur le cancer de l'ovaire démontre que l'effet thérapeutique ciblé va au-delà des seules mutations germinales de BRCA et s'applique plus largement à la DRH. On ne sait pas encore si les modifications épigénétiques des gènes HRD confèrent la même sensibilité thérapeutique, mais de futures études permettront probablement de mieux comprendre leurs mécanismes sous-jacents et leur signification clinique. La liste des gènes associés au cancer de l'ovaire continue de s'allonger et la littérature suggère actuellement que jusqu'à une femme sur quatre atteinte d'un cancer de l'ovaire aura un déficit en RH germinal et 5 à 7 % supplémentaires auront un déficit en RH somatique. Actuellement, ces patientes atteintes d'une maladie récurrente sont des candidates pour un traitement approuvé avec des inhibiteurs de PARP, mais dans un avenir proche, il y aura probablement une liste croissante de thérapies ciblées disponibles pour les patientes atteintes d'un cancer de l'ovaire. En conséquence, l'infrastructure pour les tests de DRH somatique à grande échelle dans la pratique clinique de routine, comme c'est le cas pour HER2 dans le cancer du sein et le récepteur du facteur de croissance épidermique dans le cancer du poumon, devrait être soutenue [8]. De plus, dans le contexte d'entretien où les inhibiteurs de PARP peuvent être utiles chez tous les patients, comme l'a noté l'essai NOVA, le test HRD peut être utile pour le conseil afin de comprendre l'ampleur du bénéfice dans le contexte des risques d'effets secondaires. Les tests de lignée germinale et de tumeurs somatiques fournissent des informations cliniques importantes et non chevauchantes. Des recherches supplémentaires sont nécessaires pour déterminer si les tests somatiques peuvent remplacer complètement les tests de lignée germinale ou si la pratique du test universel des tumeurs somatiques suivie d'une confirmation dirigée de la lignée germinale doit être mise en œuvre.