Informations

3.3 : Exemple de mutations humaines - Biologie


Fibrose kystique (FK) – autosmale récessive

Fibrose kystique (FK) est l'une des nombreuses maladies dont les généticiens ont montré qu'elles étaient causées par la mutation d'un seul gène bien caractérisé. La maladie est due à une mutation du CFTR (Cystic Fibrosis Transmembrane Conductance Regulator), qui a été identifié par Lap-chee Tsuidu groupe de l'Université de Toronto.

Les tissus épithéliaux de certains organes dépendent de la protéine CFTR pour transporter les ions (en particulier Cl-) à travers leurs membranes cellulaires. Le passage des ions à travers un canal à six côtés est contrôlé par une autre partie de la protéine CFTR, qui se lie à l'ATP. Si l'activité du CFTR est insuffisante, il en résulte un déséquilibre de la concentration en ions, qui perturbe les propriétés de la couche liquide qui se forme normalement à la surface épithéliale. Dans les poumons, cela provoque une accumulation de mucus et peut entraîner une infection. Les défauts du CFTR affectent également le pancréas, le foie, les intestins et les glandes sudoripares, qui ont tous besoin de ce transport d'ions. Le CFTR est également exprimé à des niveaux élevés dans les glandes salivaires et la vessie, mais les défauts de fonctionnement du CFTR ne causent pas de problèmes dans ces organes, probablement parce que d'autres transporteurs d'ions sont capables de compenser.

Plus d'un millier d'allèles mutants différents de CFTR ont été décrits. Toute mutation qui empêche CFTR de transporter suffisamment d'ions peut conduire à la mucoviscidose (FK). Dans le monde, l'allèle CFTR le plus courant chez les patients atteints de mucoviscidose est appelé F508 (delta-F508; ou PHE508DEL), qui est une délétion de trois nucléotides qui élimine une phénylalanine de la position 508 de la protéine de type sauvage 1480 aa. La mutation ΔF508 provoque un repliement incorrect du CFTR dans le réticulum endoplasmique (RE), ce qui empêche le CFTR d'atteindre la membrane cellulaire. ΔF508 représente environ 70 % des cas de mucoviscidose en Amérique du Nord, avec environ 1/25 personnes d'origine européenne qui en sont porteuses. La fréquence élevée de l'allèle ΔF508 a conduit à spéculer qu'il pourrait conférer un certain avantage sélectif aux hétérozygotes, peut-être en réduisant la déshydratation pendant les épidémies de choléra, ou en réduisant la sensibilité à certains agents pathogènes qui se lient aux membranes épithéliales.

Le CFTR est également remarquable car il s'agit de l'une des maladies génétiques bien caractérisées pour lesquelles un médicament a été développé qui compense les effets d'une mutation spécifique. La drogue, Kalydeco, a été approuvé par la FDA et Santé Canada en 2012, des décennies après que le gène CFTR a été cartographié pour la première fois sur des marqueurs d'ADN (en 1985) et cloné (en 1989). Kalydeco n'est efficace que sur certaines mutations CFTR, notamment G551D (c'est-à-dire où la glycine est substituée par l'acide aspartique à la position 551 de la protéine ; GLY551ASP). Cette mutation est retrouvée chez moins de 5 % des patients atteints de mucoviscidose. La mutation G551D affecte la capacité de l'ATP à se lier au CFTR et à lui ouvrir le canal pour le transport. Kalydeco compense la mutation en se liant au CFTR et en le maintenant dans une conformation ouverte. Kalydeco devrait coûter environ 250 000 $ par patient et par an.


L'humain évolue encore : 3 exemples d'adaptations récentes

L'évolution est un processus continu, bien que beaucoup ne réalisent pas que les gens évoluent encore. C'est vrai que Homo sapiens semble très différent de Australopithèque afarensis, un hominidé primitif qui a vécu il y a environ 2,9 millions d'années. Mais il est aussi vrai que nous sommes très différents des membres de notre même espèce, Homo sapiens, qui vivait il y a 10 000 ans - et nous serons très probablement différents des humains du futur.

Ce que nous mangeons, comment nous utilisons notre corps et avec qui nous choisissons d'avoir des enfants ne sont que quelques-uns des nombreux facteurs qui peuvent faire changer le corps humain. Les mutations génétiques conduisent à de nouveaux traits - et avec la population mondiale maintenant supérieure à 7 milliards et en augmentation, les chances de mutations génétiques sur lesquelles la sélection naturelle peut potentiellement agir ne font qu'augmenter.

Ne nous croyez pas ? Inverse présente trois exemples de changements récents dans le corps humain.

Récent, c'est-à-dire en évolutionniste termes. Après tout, Homo sapiens n'existent que depuis environ 200 000 ans - et la Terre a près de 4,5 milliards d'années.

3. Nous nous refroidissons

En 1868, un médecin allemand a publié un manuel médical qui établissait à 98,6 degrés Fahrenheit la température humaine "normale". Depuis lors, 98,6 degrés ont été généralement acceptés comme température moyenne. Au-dessus de cela, et vous avez de la fièvre. En dessous de cela, et vous avez l'hypothermie.

Mais cette température Goldilocks devient rapidement obsolète. En janvier, les scientifiques ont découvert que nous sommes en réalité bien plus cool que nous ne le pensons.

Selon leur étude, publiée en janvier dans la revue eLife, la température moyenne est beaucoup plus susceptible d'être 97,9 degrés.

L'équipe a analysé les dossiers médicaux des 200 dernières années, qui comprenaient des mesures de température. Ils ont constaté que, en moyenne, les enregistrements indiquent qu'il y a eu une diminution progressive de la température corporelle de 0,05 degrés Fahrenheit chaque décennie.

Julie Parsonnet, auteur principal de l'étude et professeur de médecine à l'Université de Stanford, raconte Inverse que cette tendance au refroidissement est probablement liée à un déclin de l'inflammation à l'échelle de la population et à une amélioration du niveau de vie.

La plupart des maladies infectieuses courantes au XIXe siècle auraient provoqué une inflammation chronique, qui à son tour brûle des calories et augmente le taux métabolique d'une personne, augmentant ainsi sa température interne, dit-elle. Parce que les gens ne combattent plus ces maladies au même rythme, ce changement se refléterait dans la température corporelle, théorise-t-elle.

Vivre confortablement à l'intérieur peut également avoir un impact profond sur les humains. Contrairement à nos ancêtres, "nous n'avons pas à travailler très dur pour être à des températures physiologiquement neutres qui ne grèvent pas notre métabolisme", dit Parsonnet.

Bien qu'un mode de vie plus sain soit probablement à l'origine de cette tendance au refroidissement, il n'est pas clair si une température plus basse améliore nécessairement notre santé. Le changement semble signifier que nous avons besoin d'environ 150 calories de moins par jour pour maintenir nos besoins métaboliques de base que par le passé, dit-elle. Mais toutes les autres conséquences doivent encore être déterminées - et bien que nous ayons besoin de moins de calories, nous ne semblons pas en manger moins.

« Nous sommes tellement en meilleure santé que les humains du XIXe siècle », dit Parsonnet. Et encore. « Nous sommes devenus plus gros, plus grands et nous sommes devenus plus frais. Pouvons-nous faire encore plus frais ? Je m'y attends, mais je ne sais pas combien.

2. Nos gènes changent constamment

Les humains ne sont pas à l'abri des effets de la sélection naturelle, explique Joshua Akey, professeur à l'université de Princeton. Inverse. Bon nombre des mêmes pressions auxquelles nous avons été confrontées tout au long de l'histoire de la race humaine, comme les agents pathogènes, existent toujours et menacent notre santé aujourd'hui. Mais notre environnement a radicalement changé – et cela doit avoir un impact, dit-il.

"Notre environnement est certainement différent de ce qu'il était il y a même un siècle, et il n'est pas difficile d'imaginer des choses comme l'évolution de la culture des gènes jouant un rôle encore plus important dans l'avenir de l'évolution humaine", a déclaré Akey..

Son exemple préféré de récente positif sélection est FADS2, qui est considéré comme un gène alimentaire important. Différentes versions de ce gène s'adaptent à différentes populations, selon qu'elles ont ou non un régime alimentaire à base de viande ou de plantes, explique Akey. Par exemple : en 2016, des scientifiques ont découvert qu'au fil des générations, le fait de suivre un régime végétarien a amené une population de Pune, en Inde, à afficher une fréquence plus élevée d'une mutation spécifique sur le gène FADS2. La mutation leur a permis de traiter efficacement les acides gras oméga-3 et oméga-6 provenant de sources autres que la viande et de les convertir en composés essentiels à la santé du cerveau, ce à quoi les personnes qui suivent un régime omnivore ne sont pas nécessairement adaptées.

Dans le même temps, les gènes qui contrôlent la tolérance au lactose sont également en augmentation. Il y a plusieurs milliers d'années, l'enzyme qui aide les gens à boire du lait sans tomber malade s'est éteinte lorsque les gens ont atteint l'âge adulte. Mais des mutations génétiques ultérieures qui ont surgi dans le monde au cours d'une période comprise entre 2 000 et 20 000 ans ont aidé les gens à tolérer les produits laitiers jusqu'à leur adolescence. Les chercheurs estiment qu'en Afrique de l'Est, ce changement génétique s'est produit il y a à peine 3 000 ans, alors que l'élevage de bétail est devenu une partie plus importante de la vie humaine.

Les transitions dans la façon dont nous vivons nos vies - comme passer d'éleveur nomade à agriculteur, puis d'agriculteur à ouvrier industriel - entraînent souvent ces adaptations génétiques. Un autre exemple de ceci est un lien apparent entre la vie urbaine et être mieux adapté pour lutter contre la tuberculose. En 2010, les scientifiques ont découvert une association statistiquement significative entre les populations qui ont une longue histoire d'urbanisation et un gène associé à la résistance à la tuberculose. Cette innovation évolutive s'est probablement produite au cours des 8 000 dernières années.

Mark Thomas, professeur à l'University College London, est l'un des chercheurs qui a découvert ce lien. Il dit Inverse qu'avant de devenir des agriculteurs sédentaires, les populations humaines étaient exposées à un ensemble différent de maladies infectieuses par rapport à celles qui nous préoccupent aujourd'hui. Ces maladies étaient plus « opportunistes et chroniques » – comme les vers, dit-il. Lorsque la société humaine s'est déplacée vers les grandes agglomérations urbaines, les maladies se sont également déplacées.

« Au cours des 10 000 dernières années, nous avons évolué en réponse aux types de maladies auxquelles nous sommes exposés », explique Thomas. « La résistance aux agents pathogènes est en grande partie génétique, ce qui signifie que la sélection naturelle se produit. C’est l’un des principaux types de sélection naturelle en cours dans tous les espaces. »

1. Nos os deviennent plus légers

Comparés aux autres hominidés, les os humains sont plus faibles et moins denses. Dans une étude de 2015, les scientifiques ont émis l'hypothèse que Homo sapiens les os ont commencé à s'affaiblir il y a environ 12 000 ans, à peu près à l'époque où les gens ont commencé à cultiver davantage. Avec l'agriculture sédentaire, notre alimentation a changé, l'activité physique a changé et, à son tour, nos squelettes sont devenus plus légers et plus fragiles.

L'étude a révélé que le tissu osseux trabéculaire - le tissu poreux et spongieux trouvé à l'extrémité des os longs comme votre fémur - diminuait en épaisseur et en volume. Moins de chasse nomade et un élevage plus sédentaire signifiaient que le besoin d'os plus lourds et plus durables diminuait. Ce changement de densité osseuse persiste aujourd'hui chez l'homme moderne.

"Notre étude montre que les humains modernes ont une densité osseuse inférieure à celle observée chez les espèces apparentées, et peu importe si nous regardons les os de personnes qui vivaient dans une société industrielle ou de populations agricoles qui avaient une vie plus active", a expliqué l'auteur principal. Habiba Chirchir, anthropologue biologique.

Dans un article de 2014, les scientifiques ont également déterminé que nos squelettes sont devenus beaucoup plus légers depuis l'essor de l'agriculture. Ils soutiennent que la réduction de l'activité physique, plutôt qu'un changement de régime alimentaire, est à l'origine de la dégradation de la solidité des os humains. La tendance devrait se poursuivre – les gens bougent moins que jamais, ont déclaré les chercheurs.

"Ce n'est qu'au cours des 50 à 100 dernières années que nous avons été si sédentaires - dangereusement", a expliqué le co-auteur Colin Shaw, chercheur à l'Université de Cambridge. « S'asseoir dans une voiture ou devant un bureau n'est pas ce pour quoi nous avons évolué. »

Les humains ont la capacité d'être aussi forts qu'un orang-outan, disent Shaw et son équipe. Mais nous ne le sommes pas parce que nous ne défions pas nos os. Seul le temps nous dira si nos os changeront une fois de plus pour nous permettre de les défier en force à l'avenir.

Nous verrons également si d'autres changements se produisent dans le corps - et si nous pouvons ou non nous aider avec les nouvelles technologies, comme l'édition de gènes. Certains scientifiques émettent l'hypothèse que les humains dépasseront le rythme de l'évolution avec nos propres inventions. Que cela se produise ou non, une chose est sûre : notre biologie ne restera jamais immobile.


Méthodes

Base de données du génome

La base de données d'agrégation du génome (gnomAD version 2.1.1) a rassemblé des données de séquence d'exome de 125 748 individus non apparentés avec un âge médian de 55 ans mais couvrant le spectre de l'âge adulte. 21 Le gnomAD exclut les personnes atteintes de maladies graves d'apparition pédiatrique, y compris les syndromes IBMF et les tumeurs malignes. Les caractéristiques démographiques de l'ensemble de données gnomAD et des cohortes dont il est dérivé sont résumées dans les tableaux supplémentaires 1 et 2. Pour la validation, nous avons utilisé 2 ensembles de données génomiques indépendants de 71 702 génomes séquencés inclus dans la version 3.0 de gnomAD et 15 708 génomes inclus dans gnomAD version 2.1.1 (tableaux supplémentaires 3 et 4).

Sélection de gènes IBMF

Une centaine de gènes avec des variantes connues associées à la prédisposition IBMF/MDS ont été interrogés pour les variantes pLoF. Ce panel de gènes contient des gènes inclus dans le panel de séquençage IBMF de nouvelle génération approuvé par Clinical Laboratory Improvement Amendments à l'Hôpital pour enfants de Philadelphie (CHOP), complété par des gènes associés à IBMF/MDS signalés après la création du panel CHOP IBMF. 22 Gènes qui médient la maladie par le gain de fonction ou des mécanismes dominants négatifs similaires (p. ELANE) ont été exclus.

Variantes LoF

Nous avons utilisé le LOFTEE (Loss-Of-Function Transcript Effect Estimator), un processus de filtrage rigoureux, pour identifier les variants pLoF de haute confiance dans l'IBMF et les gènes associés au syndrome de prédisposition. 21 Comme décrit précédemment, le prédicteur d'effet de variant identifie les variants pLoF de haute confiance qui provoquent un arrêt prématuré, un décalage du cadre de lecture ou une altération de 2 nucléotides essentiels du site d'épissage. Les variantes putatives ont été filtrées à travers LOFTEE, et les variantes prédisant échapper à la désintégration induite par le non-sens ont été supprimées. En tant que contrôle qualité, des variantes d'un sous-groupe de gènes ont été sélectionnées manuellement, montrant que les algorithmes de filtrage informatique sélectionnaient rigoureusement les vraies variantes LoF. Les variantes pLoF uniques observées provenant de variantes mononucléotidiques (SNV) ont été signalées pour chaque gène et comparées au nombre attendu de variantes pLoF en utilisant des algorithmes décrits précédemment qui incorporaient des variables telles que la taille du gène, la mutabilité et l'état de méthylation. La fréquence globale de toutes les variantes de pLoF dans chaque gène a été déterminée en additionnant les SNV et les insertions/suppressions susceptibles de provoquer la LoF. Nous avons estimé le fardeau mutationnel pour chaque gène et, globalement, pour chaque sous-groupe de maladies (p. ex., troubles de la biologie des télomères, troubles héréditaires des globules rouges). Les gènes avec un phénotype clinique rapporté dans les états d'haplo-insuffisance et d'inactivation biallélique avaient une fréquence d'haplo-insuffisance calculée. Un diagramme du flux de travail analytique est présenté à la figure 1.

Pipeline d'analyse des variantes IBMF. L'organigramme du flux de travail analytique pour l'analyse des variantes pLoF dans 100 gènes liés à l'IBMF et à la prédisposition à la malignité hématologique. RPS17 est situé dans une duplication segmentaire et ne se prête donc pas à une analyse basée sur des séquences dans l'ensemble de données gnomAD. indels, insertions/suppressions WES, séquençage de l'exome entier.

Pipeline d'analyse des variantes IBMF. L'organigramme du flux de travail analytique pour l'analyse des variantes pLoF dans 100 gènes liés à l'IBMF et à la prédisposition à la malignité hématologique. RPS17 est situé dans une duplication segmentaire et ne se prête donc pas à une analyse basée sur des séquences dans l'ensemble de données gnomAD. indels, insertions/suppressions WES, séquençage de l'exome entier.

Calculs de tolérance/intolérance génétique (contrainte évolutive)

La proportion d'haplotypes avec des variantes de pLoF a été calculée comme décrit précédemment pour déterminer la fréquence globale de pLoF pour chaque gène. 21 Ces données ont été analysées en utilisant 2 métriques de contrainte mutationnelle qui détectent l'épuisement de la variation dans l'évolution humaine récente. Le premier, « la fraction de la limite supérieure observée/attendue de perte de fonction » (LOEUF), représente une estimation prudente du rapport entre les variants pLoF observés et attendus. La LOEUF pour les gènes IBMF a été calculée comme décrit précédemment, en déterminant le rapport observé/attendu des mutations dans chaque gène et en calculant l'intervalle de confiance autour de ce rapport. La limite supérieure de l'intervalle de confiance a été utilisée comme estimation prudente du rapport observé/attendu. Pour faciliter l'interprétation, les estimations de la limite supérieure observées/attendues pour chaque gène du génome humain ont été regroupées en déciles de ∼1920 gènes chacun. Les déciles LOEUF vont de 0 (le plus appauvri/contraint sur l'évolution) à 9 (non appauvri/contraint). Chaque gène a également été analysé en utilisant le score de « probabilité d'intolérance à la perte de fonction » (pLI). pLI a déjà été établi pour estimer la probabilité que LoF dans un allèle de gène provoque un phénotype haplo-insuffisant et estime la probabilité qu'un gène tombe dans la classe des gènes LoF-haplo-insuffisants. pLI a été précédemment montré pour séparer les gènes de longueur adéquate dans ceux intolérants (pLI 0,9) ou tolérants (pLI ≤ 0,1) à LoF. 23

Analyses statistiques

L'étudiant t Le test a été utilisé pour comparer l'épuisement/la contrainte de pLoF dans les gènes associés à l'IBMF par rapport aux gènes restants dans le génome. Le test exact de Fisher a été utilisé pour l'analyse de la distribution par sexe. Les scores LOEUF étaient auparavant validés statistiquement. 21 L'ensemble de données gnomAD de 125 748 exomes a fourni une puissance suffisante pour permettre le calcul du score LOEUF pour tous les gènes dans lesquels la fréquence de variante pLoF attendue était >9.2 variantes dans l'ensemble de la cohorte de l'exome. Pour les gènes qui avaient attendu pLoF <9.2, nous avons inclus les fréquences de pLoF et de variants observés et attendus, mais pas le décile LOEUF ou le pLI.


Méthodes

Collecte de données

Nous avons collecté la version récente de toutes les données SNP humaines de NCBI dbSNP (http://www.ncbi.nlm.nih.gov/SNP/) (Version : Build 150. Dernier téléchargement : janvier 2018). Le commun et tous les SNP sont étiquetés distinctement sur le site Web. La liste des 719 gènes humains liés au cancer (Fichier supplémentaire 1 : Tableau S1) a été téléchargée à partir de la dernière version du site Web du recensement des gènes du cancer (CGC, https://cancer.sanger.ac.uk/census/). Les séquences de référence du génome humain (H. sapiens, version hg19) et souris (M. musculus, version mm10) ont été téléchargés depuis UCSC Genome Browser (genome.ucsc.edu), et le génome de référence du macaque rhésus (M. mulatta, Ensembl version v89) a été téléchargé depuis Ensembl Genome Browser (www.ensembl.org).

Annotation des SNP humains

Nous avons annoté les sites SNP à l'aide du génome humain hg19 téléchargé à partir du navigateur de génome UCSC (genome.ucsc.edu). Si un SNP frappe plusieurs isoformes du même gène, le transcrit avec le CDS (transcription canonique) le plus long est retenu. Le transcrit canonique de chaque gène a été défini par le logiciel SnpEff (version 4.2) [33]. Si un SNP ne frappe aucun gène, il est annoté comme intergénique. Les gènes avec au moins un SNP commun dans le CDS sont donnés dans le fichier supplémentaire 2 : tableau S2. Toutes les informations d'un SNP donné dans le CDS, y compris la position sur le CDS, l'acide aminé avant et après la mutation, ont été déduites du fichier de sortie de SnpEff.

Analyse de conservation

Le niveau de conservation des positions génomiques est mesuré par le score phyloP (fichier hg19.100way.phyloP100way.bw, téléchargé depuis UCSC Genome Browser, genome.ucsc.edu). En bref, les sites avec un niveau de conservation plus élevé ont des scores phyloP plus élevés. Les sites orthologues (coordonnées génomiques) entre l'homme et la souris ou entre l'homme et le macaque rhésus ont été transférés avec liftOver [34] sur la base des alignements génomiques par paires. Les fichiers de la chaîne liftOver ont été téléchargés à partir du site Web de l'UCSC Genome Browser (http://hgdownload.soe.ucsc.edu/goldenPath/hg19/liftOver/). Bedtools (version 2.25) [35] a été utilisé pour extraire des séquences d'une région donnée selon le génome de référence.

Biais d'utilisation des codons

Le protocole de calcul du biais d'utilisation des codons a été réalisé par une étude précoce [21]. Le biais de codons d'un gène est calculé par l'écart (chi carré) du contenu A/T des codons synonymes par rapport à celui des régions introniques. Une déviation plus élevée indique un biais de codon plus important pour un gène. Le biais de codons d'un codon particulier est le coefficient de corrélation entre la fréquence des codons au sein d'une famille de codons synonymes et la déviation (valeur du chi carré) de chaque gène [21]. Un coefficient de corrélation plus élevé suggère un biais plus fort (préféré) pour un codon.

Nous résumons le pipeline comme suit :

Les 59 codons sens (sans ATG, TGG et trois codons stop) sont classés en 21 familles de codons synonymes. Leu (L), Arg (R) et Ser (S) ont six codons de sorte qu'une seule mutation ne pourrait parfois pas changer un codon en un autre (par exemple, AGT et TCT codent tous les deux pour Ser mais une seule mutation ne pourrait pas changer l'un en un autre ). Par conséquent, chacun de ces acides aminés doit être divisé en deux familles de codons synonymes [21].

Pour chacune des familles de codons synonymes au sein de chaque gène, nous avons calculé l'écart (chi carré) du contenu A/T à la position 3 du codon par rapport au contenu intronique A/T (59 % chez l'homme). Prenez le codon Lys (K) AAG par exemple, la famille "K" a deux codons AAG et AAA. Dans le gène X, supposons :

OAAA = nombre observé de codons AAA.

OAAG = nombre observé de codons AAG.

EAAA = (OAAA + OAAG) × 0,59, le nombre attendu de codons AAA (au sein de la famille « K »).

EAAG = (OAAA + OAAG) x (1–0,59), le nombre attendu de codons AAG (au sein de la famille « K »).

Chi carré (X 2 ) [famille K, gène X] = chisq.test(matrice(c(OAAA, ôAAG, EAAA, EAAG), ncol = 2))$ statistiques. « chisq.test » est une fonction en langage R (http://www.R-project.org/) permettant de réaliser des tests chi carré.

Pour chaque gène, le niveau de gène CUB est le « chi carré mis à l'échelle », qui est la somme des valeurs du chi carré des familles de codons au sein de ce gène normalisées par la longueur du peptide. Une valeur plus élevée du «chi carré mis à l'échelle» indique un CUB plus fort pour un gène.

Pour chacun des 59 codons sens, le niveau de codons CUB (codon préférence) est mesuré par le Spearman's Rho. Encore une fois, prenez le codon Lys AAG par exemple (la littérature originale a également pris ce codon comme exemple, veuillez vous référer à Akashi 1995 Fig. 1), la famille "K" a deux codons AAG et AAA. L'axe des Y est la fréquence d'AAG parmi "AAG + AAA" dans chaque gène (chaque point représente un gène). L'axe des X est la valeur du chi carré correspondant à l'échelle de chaque gène (Akashi 1995 Fig. 1). Le niveau de codon CUB (codon de préférence) est le niveau de Spearman Rho entre l'axe X et l'axe Y. Rho > 0 indique un codon préféré et Rho < 0 indique un codon non préféré [21]. Chez l'homme, le Rho la valeur pour le codon AAG est de 0,74.

Cet algorithme a été appliqué à tous les gènes humains et aux 59 codons sens. Il y a une tendance que les codons de terminaison G/C sont préférés et les codons de terminaison A/T ne sont pas préférés.

Le paysage des SNP humains. une Un diagramme schématique montrant le filtrage des SNP selon les sites orthologues dans les génomes du singe rhésus et de la souris. L'arbre phylogénétique est sans échelle. b Un diagramme schématique affichant la définition des SNP à mutation unique. réf., référence. Mut., mutation. c les fractions de différents types de mutations. Les annotations et les proportions des SNP génomiques (à gauche) et des SNP exoniques (à droite) après les étapes de filtrage ci-dessus. Les clip arts de humain/singe/souris ont été dessinés par nous-mêmes

Pour un codon donné, le biais de codon delta (ou de manière similaire, la fréquence de codon delta) est la différence entre les valeurs de biais de codon des versions « post-mutation » et « pré-mutation ». Le biais du codon delta (ou de manière similaire, la fréquence du codon delta) d'un gène est défini comme la valeur delta moyenne de tous les SNP dans la région codante de ce gène.

Calcul du niveau d'expression génique dans les cellules HeLa humaines

Nous avons recherché la base de données publique et choisi un ensemble de données NGS réalisé dans des cellules HeLa humaines (GES63591) [36]. La bibliothèque d'ARNm-Seq (si-control) a été utilisée pour définir le niveau d'expression des gènes. Nous avons aligné les lectures d'ARNm-Seq NGS sur le génome de référence hg19 en utilisant STAR (version 2.7) [37]. Les lectures mappées de manière unique ont été conservées pour une analyse en aval. Les comptes de lecture de chaque gène ont été calculés par htseq-count (version 0.5.4) [38]. Dans ce calcul d'expression génique, le transcrit canonique de chaque gène a été choisi et toutes les lectures chevauchant des régions d'exons ont été comptées. Les gènes hautement exprimés (9903 gènes au total) sont définis comme des gènes avec un nombre de lectures > 100. De plus, selon les SNP que nous avons récupérés, il y a 17 940 gènes qui ont des SNP dans leurs CDS. 649 des 719 gènes liés au cancer (comme mentionné ci-dessus) appartiennent à ces 17 940 gènes. Lorsque nous ne considérons que les 9903 gènes hautement exprimés dans les cellules HeLa, 8857 se chevauchent avec les 17 940 gènes avec des SNP, et 439 d'entre eux appartiennent à des gènes liés au cancer et 8418 sont d'autres gènes. Les analyses qui prennent en compte le niveau d'expression des gènes sont effectuées en utilisant ces 439 gènes liés au cancer contre 8418 autres gènes.

Analyse statistique et disponibilité du code

Toutes les analyses statistiques (tests de corrélation, tests exacts de Fisher, tests de sommation des rangs de Wilcoxon) et le travail graphique ont été menés dans l'environnement R (http://www.R-project.org/) (version 3.3.3). Tous les codes utilisés dans les analyses sont disponibles sur demande.


Méthodes

Base de données du génome

La base de données d'agrégation du génome (gnomAD version 2.1.1) a rassemblé des données de séquence d'exome de 125 748 individus non apparentés avec un âge médian de 55 ans mais couvrant le spectre de l'âge adulte. 21 Le gnomAD exclut les personnes atteintes de maladies graves d'apparition pédiatrique, y compris les syndromes IBMF et les tumeurs malignes. Les caractéristiques démographiques de l'ensemble de données gnomAD et des cohortes dont il est dérivé sont résumées dans les tableaux supplémentaires 1 et 2. Pour la validation, nous avons utilisé 2 ensembles de données génomiques indépendants de 71 702 génomes séquencés inclus dans la version 3.0 de gnomAD et 15 708 génomes inclus dans gnomAD version 2.1.1 (tableaux supplémentaires 3 et 4).

Sélection de gènes IBMF

Une centaine de gènes avec des variantes connues associées à la prédisposition IBMF/MDS ont été interrogés pour les variantes pLoF. Ce panel de gènes contient des gènes inclus dans le panel de séquençage IBMF de nouvelle génération approuvé par Clinical Laboratory Improvement Amendments à l'Hôpital pour enfants de Philadelphie (CHOP), complété par des gènes associés à IBMF/MDS signalés après la création du panel CHOP IBMF. 22 Gènes qui médient la maladie par le gain de fonction ou des mécanismes dominants négatifs similaires (p. ELANE) ont été exclus.

Variantes LoF

Nous avons utilisé le LOFTEE (Loss-Of-Function Transcript Effect Estimator), un processus de filtrage rigoureux, pour identifier les variants pLoF de haute confiance dans l'IBMF et les gènes associés au syndrome de prédisposition. 21 Comme décrit précédemment, le prédicteur d'effet de variant identifie les variants pLoF de haute confiance qui provoquent un arrêt prématuré, un décalage du cadre de lecture ou une altération de 2 nucléotides essentiels du site d'épissage. Les variantes putatives ont été filtrées à travers LOFTEE, et les variantes prédisant échapper à la désintégration induite par le non-sens ont été supprimées. En tant que contrôle qualité, des variantes d'un sous-groupe de gènes ont été sélectionnées manuellement, montrant que les algorithmes de filtrage informatique sélectionnaient rigoureusement les vraies variantes LoF. Les variantes pLoF uniques observées provenant de variantes mononucléotidiques (SNV) ont été signalées pour chaque gène et comparées au nombre attendu de variantes pLoF en utilisant des algorithmes décrits précédemment qui incorporaient des variables telles que la taille du gène, la mutabilité et l'état de méthylation. La fréquence globale de toutes les variantes de pLoF dans chaque gène a été déterminée en additionnant les SNV et les insertions/suppressions susceptibles de provoquer la LoF. Nous avons estimé la charge mutationnelle pour chaque gène et, globalement, pour chaque sous-groupe de maladies (p. ex., troubles de la biologie des télomères, troubles héréditaires des globules rouges). Les gènes avec un phénotype clinique rapporté dans les états d'haplo-insuffisance et d'inactivation biallélique avaient une fréquence d'haplo-insuffisance calculée. Un diagramme du flux de travail analytique est présenté à la figure 1.

Pipeline d'analyse des variantes IBMF. L'organigramme du flux de travail analytique pour l'analyse des variantes pLoF dans 100 gènes liés à l'IBMF et à la prédisposition à la malignité hématologique. RPS17 est situé dans une duplication segmentaire et ne se prête donc pas à une analyse basée sur des séquences dans l'ensemble de données gnomAD. indels, insertions/suppressions WES, séquençage de l'exome entier.

Pipeline d'analyse des variantes IBMF. L'organigramme du flux de travail analytique pour l'analyse des variantes pLoF dans 100 gènes liés à l'IBMF et à la prédisposition à la malignité hématologique. RPS17 est situé dans une duplication segmentaire et ne se prête donc pas à une analyse basée sur des séquences dans l'ensemble de données gnomAD. indels, insertions/suppressions WES, séquençage de l'exome entier.

Calculs de tolérance/intolérance génétique (contrainte évolutive)

La proportion d'haplotypes avec des variantes de pLoF a été calculée comme décrit précédemment pour déterminer la fréquence globale de pLoF pour chaque gène. 21 Ces données ont été analysées en utilisant 2 métriques de contrainte mutationnelle qui détectent l'épuisement de la variation dans l'évolution humaine récente. La première, « la fraction de limite supérieure observée/attendue de perte de fonction » (LOEUF), représente une estimation prudente du rapport des variants pLoF observés et attendus. La LOEUF pour les gènes IBMF a été calculée comme décrit précédemment, en déterminant le rapport observé/attendu des mutations dans chaque gène et en calculant l'intervalle de confiance autour de ce rapport. La limite supérieure de l'intervalle de confiance a été utilisée comme estimation prudente du rapport observé/attendu. Pour faciliter l'interprétation, les estimations de la limite supérieure observées/attendues pour chaque gène du génome humain ont été regroupées en déciles de ∼1920 gènes chacun. Les déciles LOEUF vont de 0 (le plus appauvri/contraint sur l'évolution) à 9 (non appauvri/contraint). Chaque gène a également été analysé en utilisant le score de « probabilité d'intolérance à la perte de fonction » (pLI). pLI a déjà été établi pour estimer la probabilité que LoF dans un allèle de gène provoque un phénotype haplo-insuffisant et estime la probabilité qu'un gène tombe dans la classe des gènes LoF-haplo-insuffisants. pLI a été précédemment montré pour séparer les gènes de longueur adéquate dans ceux intolérants (pLI 0,9) ou tolérants (pLI ≤ 0,1) à LoF. 23

Analyses statistiques

L'étudiant t Le test a été utilisé pour comparer l'épuisement/la contrainte de pLoF dans les gènes associés à l'IBMF par rapport aux gènes restants dans le génome. Le test exact de Fisher a été utilisé pour l'analyse de la distribution par sexe. Les scores LOEUF étaient auparavant validés statistiquement. 21 L'ensemble de données gnomAD de 125 748 exomes a fourni une puissance suffisante pour permettre le calcul du score LOEUF pour tous les gènes dans lesquels la fréquence de variante pLoF attendue était >9.2 variantes dans l'ensemble de la cohorte de l'exome. Pour les gènes qui avaient attendu pLoF <9.2, nous avons inclus les fréquences de pLoF et de variants observés et attendus, mais pas le décile LOEUF ou le pLI.


La plupart des mutations viennent du père : de nouvelles connaissances sur l'âge, la taille et le sexe redéfinissent la vision de l'évolution humaine

Les humains héritent plus de trois fois plus de mutations de leur père que de leur mère, et les taux de mutation augmentent avec l'âge du père mais pas celui de la mère, ont découvert des chercheurs dans la plus grande étude sur les mutations génétiques humaines à ce jour.

The study, based on the DNA of around 85,000 Icelanders, also calculates the rate of human mutation at high resolution, providing estimates of when human ancestors diverged from nonhuman primates. It is one of two papers published this week by the journal Génétique de la nature as well as one published at La nature that shed dramatic new light on human evolution.

"Most mutations come from dad," said David Reich, professor of genetics at Harvard Medical School and a co-leader of the study. In addition to finding 3.3 paternal germline mutations for each maternal mutation, the study also found that the mutation rate in fathers doubles from age 20 to 58 but that there is no association with age in mothers -- a finding that may shed light on conditions, such as autism, that correlate with the father's age.

The study's first author is James Sun, a graduate student in Reich's lab who worked with researchers from deCODE Genetics, a biopharma company based in Reykjavik, Iceland, to analyze about 2,500 short sequences of DNA taken from 85,289 Icelanders in 24,832 father-mother-child trios. The sequences, called microsatellites, vary in the number of times that they repeat, and are known to mutate at a higher rate than average places in the genome.

Reich's team identified 2,058 mutational changes, yielding a rate of mutation that suggests human and chimpanzee ancestral populations diverged between 3.7 million and 6.6 million years ago.

A second team, also based at deCODE Genetics (but not involving HMS researchers), published a paper this week in Nature on a large-scale direct estimate of the rate of single nucleotide substitutions in human genomes (a different type of mutation process), and came to largely consistent findings.

The finding complicates theories drawn from the fossil evidence. The upper bound, 6.6 million years, is less than the published date of Sahelanthropus tchadensis, a fossil that has been interpreted to be a human ancestor since the separation of chimpanzees, but is dated to around 7 million years old. The new study suggests that this fossil may be incorrectly interpreted.

Great Heights

A second study led by HMS researchers, also published in Génétique de la nature this week, adds to the picture of human evolution, describing a newly observable form of recent genetic adaptation.

The team led by Joel Hirschhorn, Concordia Professor of Pediatrics and professor of genetics at Boston Children's Hospital and HMS, first asked why closely-related populations can have noticeably different average heights. David Reich also contributed to this study.

They examined genome-wide association data and found that average differences in height across Europe are partly due to genetic factors. They then showed that these genetic differences are the result of an evolutionary process that acts on variation in many genes at once. This type of evolution had been proposed to exist but had not previously been detected in humans.

Although recent human evolution is difficult to observe directly, some of its impact can be inferred by studying the human genome. In recent years, genetic studies have uncovered many examples where recent evolution has left a distinctive signature on the human genome. The clearest "footprints" of evolution have been seen in regions of DNA surrounding mutations that occurred fairly recently (typically in the last several thousand years) and confer an advantageous trait, such as resistance to malaria. Hirschhorn's team observed, for the first time in humans, a different signature of recent evolution: widespread small but consistent changes at many different places in the genome, all affecting the same trait, adult height.

"This paper offers the first proof and clear example of a new kind of human evolution for a specific trait," said Hirschhorn, who is also a senior associate member of the Broad Institute. "We provide a demonstration of how humans have been able to adapt rapidly without needing to wait for new mutations to happen, by drawing instead on the existing genetic diversity within the human population."

Average heights can differ between populations, even populations that are genetically very similar, which suggests that human height might have been evolving differently across these populations. Hirschhorn's team studied variants in the genome that are known to have small but consistent effects on height: people inheriting the "tall" version of these variants are known to be slightly taller on average than people inheriting the "short" versions of the same variants.

The researchers discovered that, in northern Europe, the "tall" versions of these variants are consistently a little more common than they are in southern Europe. The combined effects of the "tall" versions being more common can partly explain why northern Europeans are on average taller than southern Europeans. The researchers then showed that these slight differences have arisen as a result of evolution acting at many variants, and acting differently in northern than in southern Europe.

"This paper explains -- at least in part -- why some European populations, such as people from Sweden, are taller on average than others, such as people from Italy," Hirschhorn said.

The researchers were only able to detect this signature of evolution by using the results of recent genome-wide association studies by the GIANT consortium, which identified hundreds of different genetic variants that influence height.


Discussion

We demonstrate here that several alternative three-amino-acid mutations (V186G/K-K193T-G228S or V186N-N224K-G228S) can switch the receptor specificity of the H7N9 HA from avian- to human-type, a property required for transmission in humans and ferrets [38, 39]. Of these mutations, only isolated examples of 186G and 193N have to date been reported in H7 avian isolates. The mutants show profound loss of binding to avian-type (α2–3 linked) receptors, and increased binding to human-type (α2–6 linked) receptors in both glycan microarrays and glycan ELISA-type avidity assays. The mutants exhibit preferential binding to a subset of human-type receptors with extended branched N-linked glycans that terminate with NeuAcα2-6Gal reported to be present in N-linked glycans in human and ferret airway tissues [23, 40, 41]. Notably, this specificity for a restricted subset of human-type receptors is shared with recent H3N2 viruses, and the 2009 H1N1 pandemic virus. We have also recently observed that different sets of mutations switch the H6N1 and H10N8 HAs to human-type receptor specificity and, in each case, confer specificity for a similar subset of human-type receptors [37] (de Vries, Tzarum, Wilson & Paulson manuscript in revision). Thus, recognition of human-type receptors with extended glycan chains appears to be a common characteristic of human influenza virus HAs, and avian virus HA mutants that bind to human-type receptors.

Ideally, it would be important to assess the impact of the switch in receptor specificity in the ferret model that displays human-type receptors in the airway epithelium and is used to assess the propensity for air droplet transmission of human viruses. However, the introduction of the mutations that switch receptor specificity into an actual H7N9 virus background would represent gain-of-function (GoF) experiments that are currently prohibited [42]. During the course of this study, no viruses were created, and no experiments assessing the potential for air droplet transmission were performed. We suggest that understanding mutations that can confer human-type receptor binding will benefit risk assessment in worldwide surveillance of H7N9 in poultry and humans.


The Ames Test

Les Ames test, developed by Bruce Amès (1928–) in the 1970s, is a method that uses bacteria for rapid, inexpensive screening of the carcinogenic potential of new chemical compounds. The test measures the mutation rate associated with exposure to the compound, which, if elevated, may indicate that exposure to this compound is associated with greater cancer risk. The Ames test uses as the test organism a strain of Salmonelle typhimurium that is a histidine auxotroph, unable to synthesize its own histidine because of a mutation in an essential gene required for its synthesis. After exposure to a potential mutagen, these bacteria are plated onto a medium lacking histidine, and the number of mutants regaining the ability to synthesize histidine is recorded and compared with the number of such mutants that arise in the absence of the potential mutagen (Figure 8). Chemicals that are more mutagenic will bring about more mutants with restored histidine synthesis in the Ames test. Because many chemicals are not directly mutagenic but are metabolized to mutagenic forms by liver enzymes, rat liver extract is commonly included at the start of this experiment to mimic liver metabolism. After the Ames test is conducted, compounds identified as mutagenic are further tested for their potential carcinogenic properties by using other models, including animal models like mice and rats.

Figure 8. The Ames test is used to identify mutagenic, potentially carcinogenic chemicals. A Salmonella histidine auxotroph is used as the test strain, exposed to a potential mutagen/carcinogen. The number of reversion mutants capable of growing in the absence of supplied histidine is counted and compared with the number of natural reversion mutants that arise in the absence of the potential mutagen.

Pensez-y

  • What mutation is used as an indicator of mutation rate in the Ames test?
  • Why can the Ames test work as a test for carcinogenicity?

Concepts clés et résumé

  • UNE mutation is a heritable change in DNA. A mutation may lead to a change in the amino-acid sequence of a protein, possibly affecting its function.
  • UNE point de mutation affects a single base pair. A point mutation may cause a silent mutation if the mRNA codon codes for the same amino acid, a missense mutation if the mRNA codon codes for a different amino acid, or a nonsense mutation if the mRNA codon becomes a stop codon.
  • Missense mutations may retain function, depending on the chemistry of the new amino acid and its location in the protein. Nonsense mutations produce truncated and frequently nonfunctional proteins.
  • UNE mutation de décalage de cadre results from an insertion or deletion of a number of nucleotides that is not a multiple of three. The change in reading frame alters every amino acid after the point of the mutation and results in a nonfunctional protein.
  • Spontaneous mutations occur through DNA replication errors, whereas induced mutations occur through exposure to a mutagen.
  • Mutagenic agents are frequently carcinogenic but not always. However, nearly all carcinogens are mutagenic.
  • Chemical mutagens include base analogs and chemicals that modify existing bases. In both cases, mutations are introduced after several rounds of DNA replication.
  • Ionizing radiation, such as X-rays and γ-rays, leads to breakage of the phosphodiester backbone of DNA and can also chemically modify bases to alter their base-pairing rules.
  • Nonionizing radiation like ultraviolet light may introduce pyrimidine (thymine) dimers, which, during DNA replication and transcription, may introduce frameshift or point mutations.
  • Cells have mechanisms to repair naturally occurring mutations. DNA polymerase has proofreading activity. Mismatch repair is a process to repair incorrectly incorporated bases after DNA replication has been completed.
  • Pyrimidine dimers can also be repaired. Dans nucleotide excision repair (dark repair), enzymes recognize the distortion introduced by the pyrimidine dimer and replace the damaged strand with the correct bases, using the undamaged DNA strand as a template. Bacteria and other organisms may also use direct repair, in which the photolyase enzyme, in the presence of visible light, breaks apart the pyrimidines.
  • Through comparison of growth on the complete plate and lack of growth on media lacking specific nutrients, specific loss-of-function mutants called auxotrophes can be identified.
  • Les Ames test is an inexpensive method that uses auxotrophic bacteria to measure mutagenicity of a chemical compound. Mutagenicity is an indicator of carcinogenic potential.

Choix multiple

Which of the following is a change in the sequence that leads to formation of a stop codon?

  1. missense mutation
  2. nonsense mutation
  3. silent mutation
  4. mutation par délétion

The formation of pyrimidine dimers results from which of the following?

  1. spontaneous errors by DNA polymerase
  2. exposure to gamma radiation
  3. exposure to ultraviolet radiation
  4. exposure to intercalating agents

Which of the following is an example of a frameshift mutation?

  1. a deletion of a codon
  2. missense mutation
  3. silent mutation
  4. deletion of one nucleotide

Which of the following is the type of DNA repair in which thymine dimers are directly broken down by the enzyme photolyase?

  1. direct repair
  2. réparation par excision de nucléotides
  3. réparation de discordance
  4. relecture

Which of the following regarding the Ames test is true?

  1. It is used to identify newly formed auxotrophic mutants.
  2. It is used to identify mutants with restored biosynthetic activity.
  3. It is used to identify spontaneous mutants.
  4. It is used to identify mutants lacking photoreactivation activity.

Remplir les trous

A chemical mutagen that is structurally similar to a nucleotide but has different base-pairing rules is called a ________.

The enzyme used in light repair to split thymine dimers is called ________.

The phenotype of an organism that is most commonly observed in nature is called the ________.

Vrai faux

Carcinogens are typically mutagenic.

Pensez-y

Why is it more likely that insertions or deletions will be more detrimental to a cell than point mutations?

Why do you think the Ames test is preferable to the use of animal models to screen chemical compounds for mutagenicity?

Esprit critique

Below are several DNA sequences that are mutated compared with the wild-type sequence: 3′-T A C T G A C T G A C G A T C-5′. Envision that each is a section of a DNA molecule that has separated in preparation for transcription, so you are only seeing the template strand. Construct the complementary DNA sequences (indicating 5′ and 3′ ends) for each mutated DNA sequence, then transcribe (indicating 5′ and 3′ ends) the template strands, and translate the mRNA molecules using the genetic code, recording the resulting amino acid sequence (indicating the N and C termini). What type of mutation is each?


Autosomal Dominant IRF8 Deficiency

In parallel with our analysis for Subject 1 with recessive disease, we sequenced IRF8 in 454 persons with MSMD in whom known MSMD-associated mutations had already been excluded (for details, see the Supplementary Appendix). Two unrelated persons from Brazil (Subject 2) and Chile (Subject 3) who had recurrent episodes of disseminated BCG disease were each found to carry the same de novo heterozygous mutation that was predicted to cause a threonine-to-alanine substitution at position 80 (T80A) of IRF8 ( Figure 2A and 2D ). We genetically confirmed the reported biologic paternity of these two subjects. The finding that each mutation was de novo suggests that the same T80A allele arose independently on two occasions. We did not detect the T80A variant in 1064 healthy control subjects of diverse relevant ancestry (for details, see the Supplementary Appendix). Amino acid position 80 of IRF8 is within the DNA-binding domain ( Figure 2A ). The threonine residue is strictly conserved across IRF8 orthologues ( Figure 2B ) and human paralogous genes (data not shown).

The T80A mutation had no effect on the level or stability of IRF8 in immortalized B-cell lines derived from the subjects ( Figure 3E ) or after expression in transfected macrophages (data not shown). When the T80A mutant was tested for its ability to transactivate the promoters of IL12B ( Figure 3A ) and NOS2 ( Figure 3B ) in mouse macrophages, it showed relatively low activity, similar to that of the hypomorphic R294C Irf8 variant found in Irf8-deficient BXH2 mutant mice. The T80A mutant showed weak recruitment to the IL12B promoter (20% of the amount of the nonmutant IRF8 protein), suggesting that the mutation interferes with DNA binding ( Figure 3D ).

Homology modeling shows that T80 maps to the DNA-binding α helix of IRF8 that fits into the major groove, with its side chain directed toward the DNA bases ( Figure 2E, subpanel c ). Molecular-dynamics simulations indicate that T80A alters the hydrophobic interface between the protein and DNA and possibly modulates the DNA-binding specificity of IRF8 ( Figure 2E, subpanel d ). Alanine has a smaller side chain than does threonine, which may allow the entry of a water molecule at the DNA–IRF8 interface. Although functional data suggest that T80A is severely hypomorphic, we investigated whether the T80A variant is negatively dominant (i.e., whether it interferes with the function of the nonmutant IRF8 protein). We coexpressed the mutant and nonmutant alleles in macrophages ( Figure 3C ) and observed decreasing activation of the IL12B promoter (not shown) and the NOS2 promoter with increasing levels of mutant T80A IRF8 added to fixed levels of nonvariant IRF8. The effect was T80A-specific we did not observe it to be associated with K108E (data not shown) or R294C mutant proteins. We conclude that the T80A mutation has a dual effect on IRF8 function and causes autosomal dominant MSMD.

Figure 4. Figure 4. Selective Depletion of Dendritic Cells in Autosomal Dominant IRF8 Deficiency.

In Panel A, blood CD1c+ myeloid dendritic cells (MDCs) are gated on HLA-DR+ lineage (Lin)-negative cells (CD14−CD16−CD19−), and the expression of CD11c+ and CD1c+ is shown. The percentage of DR+CD11c+ lineage-negative cells that are positive for CD1c+ is shown for Subjects 2 and 3 (who carry the T80A allele), their relatives, and control subjects. Horizontal lines indicate mean values, and the numbers on contour plots represent the mean of two independent samples. In Panel B, blood CD141+ MDCs are gated on HLA-DR+ lineage-negative cells (CD14−CD16−CD19−), and the expression of CD11c and CD141 is shown. The percentage of DR+CD11c+ lineage-negative cells with a high level of CD141 expression on the cell surface is shown. In Panel C, plasmacytoid dendritic cells (PDCs) are gated on HLA-DR+ lineage-negative cells (CD14−CD16−), and the expression of CD123 and BDCA2 is shown. The percentage of DR+ cells that are positive for CD123 and BDCA2 is shown. In Panel D, monocytes are gated on HLA-DR+ lineage-negative cells (CD2−CD15−CD19−Nkp46−), and the expression of CD14 and CD16 is shown. The numbers on the contour plots represent the percentage of each subgroup (low and high expression of CD14 and CD14+CD16+) among total monocytes. In Panel D, the percentage of peripheral-blood mononuclear cells (PBMCs) that are positive for CD14 or CD16 is shown for Subject 2, his relatives, and a control subject. In Panel E, the mean (±SD) production of IL-12p70 protein in response to R848 is shown in four samples of blood CD1c+ MDCs, in three samples of PBMCs depleted in CD1c+ MDCs (PBMCs CD1c+ depleted), and in three samples of PBMCs not depleted (PBMCs), obtained by fluorescence-activated cell sorting from healthy control subjects (white bars) and in PBMCs from Subject 2, his parents, and a control subject collected at the same time (gray bars).

We observed subtle deficits in the PBMCs of Subjects 2 and 3. There were no deficiencies of circulating lymphocytes and granulocytes (data not shown), monocyte subgroups, or BDCA2+CD123+ plasmacytoid dendritic cells ( Figure 4C and 4D ). However, within CD11c+ myeloid dendritic cells, which are normally divided into minor CD141+ and major CD1c+ subgroups, there was marked loss of CD1c+ dendritic cells ( Figure 4A ), whereas the CD141+ subgroup and the total number of CD11c+ dendritic cells remained intact ( Figure 4B ). CD1c+ dendritic cells from unaffected persons can produce large amounts of interleukin-12 when stimulated with the toll-like receptor 7/8 ligand R848, as compared with PBMCs, whereas their depletion from PMBCs was associated with relatively low levels of interleukin-12 production by the remaining PBMCs (P<0.02 for all comparisons) ( Figure 4E ). PBMCs with the IRF8 T80A allele produced one third the amount of interleukin-12 produced by control cells in response to R848 stimulation (P<0.004 for all comparisons) ( Figure 4E ).

We suggest that depletion of interleukin-12–producing CD1c+ dendritic cells contributes to the susceptibility to mycobacterial disease in these subjects. In vitro assays of whole blood from the affected subjects showed no detectable effect on the production of interferon-γ (Figure S6 in the Supplementary Appendix) or in the subjects' PBMCs in response to stimulation by purified protein derivative (PPD), BCG, or PHA (Figure S7 in the Supplementary Appendix) or by PHA-driven T-cell blasts stimulated with interleukin-12 (data not shown). The presence of T80A does not seem to cause a generalized defect in interleukin-12 production, as shown by normal levels of the cytokine in a whole-blood assay in response to BCG, in monocyte-derived dendritic cells stimulated with CD40L, and by Epstein–Barr virus–transformed B cells stimulated with phorbol dibutyrate (Figure S6, S8A, and S8B in the Supplementary Appendix). Because the two healthy heterozygous parents of the infant with autosomal recessive IRF8 deficiency had normal levels of functional dendritic cells, the marked deficit of CD1c+CD11c+ dendritic cells was probably caused by the dominant-negative effect of the T80A mutant protein.


Conclusion

We have characterized, for the first time, the shape of the time-dependent rate curve of human mtDNA mutation rate estimates for both the hypervariable and coding regions. We have shown that multiple hits can effectively account for the difference between pedigree-based and human versus chimpanzee phylogeny-based mutation rate estimates. However, the multiple hits model is unlikely to explain the time-dependent decay for the genealogy-based estimates, where rate estimates associated with more recent events are high and then decay over 50,000 years going back in time.

Purifying selection and population bottlenecks may explain the time dependency of within-species mutation rate estimates. Specifically, the genetic diversity estimators ?? et ?? are proportional to effective population size ( Forster et al. 1996). Thus, our human diversity estimates are lower if a population history was characterized by serial bottlenecks as compared with a history of constant population size ( Nei et al. 1975). Because phylogeny-based mutation rates are calibrated with “arrival time” archaeological information that is blind to later population size fluctuations, the mutation rate estimates based on ?? et ?? are also lower than expected. Using simulation, Zhivotovsky et al. (2006) showed that microsatellite mutation rates estimated from small populations (haplogroups) undergoing serial bottlenecks are indeed reduced compared with pedigree-based rates. Alternatively, purifying selection acts to eliminate newly arising deleterious alleles and linked diversity throughout both the coding and HVRs ( Kivisild et al. 2006). This also decreases genetic diversity estimates ( Charlesworth et al. 1995) and thus the mutation rate estimates.

Our mutation rate estimates from all but the most recent samples are lower than the pedigree-based rate estimate, which is not affected by the above processes of bottlenecks and selection (except for purifying selection on lethal alleles). Purifying selection and population size changes are not mutually exclusive. Both processes could underlie the exponentially decaying mutation rate curves ( figs. 2 and 3). However, reduction in population size is expected to reduce the efficacy of natural selection relative to genetic drift.


Voir la vidéo: Comment est définie une mutation? Quels sont les types de mutations? (Janvier 2022).