Informations

Combien de variation dans le génome humain pour les humains


Nous apprenons actuellement le projet du génome humain en biologie au lycée. Le génome humain cartographié ne serait-il pas différent, disons, du mien s'il était cartographié ? Quelle est la variation entre les humains individuels dans notre séquençage génétique ? Je suppose qu'il n'y a pas beaucoup de différence puisque plusieurs volontaires ont été utilisés dans le projet. J'ai vu une autre question qui parlait du taux de mutation, donc je ne sais pas si c'est la même chose.


Vous avez raison de dire que le génome humain séquencé dans le projet a été apporté par une douzaine de volontaires anonymes. Cependant, la séquence finale qui est utilisée comme référence standard est une construction quelque peu arbitraire qui représente une collection de segments consécutifs provenant de l'un ou l'autre des contributeurs. C'est un haploïde séquence, plus un chromosome Y et un chromosome X.

Maintenant, vous demandez à quel point les génomes de deux sujets quelconques sont différents, pris au hasard dans une population. Imaginez pour plus de simplicité en regardant votre propre génome. Pour chacun des 22 autosomes, tu sais que tu as deux copies, l'une transmise par ton père, l'autre par ta mère (pour le chromosome X tu as deux copies, si tu es une fille). Imaginez maintenant comparer la séquence de chacune de vos paires de chromosomes homologues côte à côte ; rappelez-vous qu'ils sont dérivés d'individus très différents (à moins que vos parents ne soient des parents proches), de sorte qu'ils ne seront pas identiques, car ils représentent des histoires évolutives indépendantes.

Ensuite, la question devient : quelle variation y a-t-il entre les séquences de vos chromosomes appariés ? Et la réponse est connue : environ toutes les 1 000 paires de bases, vos chromosomes présentent une paire de bases dans un chromosome et une paire de bases différente dans l'autre ; sinon ils sont identiques. Les sites où cette variation se produit sont appelés SNP, pour Single Nucleotide Polymorphisms (de nombreux autres types de variation existent, mais les SNP sont les plus courants). On peut généraliser cette observation, car elle reste vraie pour n'importe quelle paire de chromosomes choisis au hasard parmi n'importe quelle paire de sujets. Ainsi, on peut dire que les humains sont identiques pour 99,9% de leurs génomes, alors que la variation génétique responsable des différences qui nous permet de nous reconnaître comme uniques sont limitées à 0,1% de notre génome.


Alors que la plupart des différences dans les génomes des personnes - appelées variantes - sont inoffensives, certaines sont bénéfiques, tandis que d'autres contribuent aux maladies et aux affections, allant des troubles cognitifs aux susceptibilités au cancer, à l'obésité, au diabète, aux maladies cardiaques et à d'autres troubles. Comprendre comment les variantes génomiques contribuent à la maladie peut aider les cliniciens à développer des diagnostics et des traitements améliorés, en plus de nouvelles méthodes de prévention.

Le National Human Genome Research Institute (NHGRI), qui fait partie des National Institutes of Health (NIH), a aidé à financer et à diriger ce consortium international public-privé de chercheurs aux États-Unis, au Royaume-Uni, en Chine, en Allemagne et au Canada.

Dans deux études publiées en ligne le 30 septembre 2015, dans La nature, les chercheurs ont examiné les génomes de 2 504 personnes de 26 populations d'Afrique, d'Asie de l'Est et du Sud, d'Europe et des Amériques.

En général La nature étude, les enquêteurs ont identifié environ 88 millions de sites dans le génome humain qui varient selon les personnes, établissant une base de données à la disposition des chercheurs comme référence standard sur la façon dont la composition génomique des personnes varie dans les populations et dans le monde. Le catalogue fait plus que doubler le nombre de sites variants connus dans le génome humain et peut désormais être utilisé dans un large éventail d'études sur la biologie et la médecine humaines, fournissant la base d'une nouvelle compréhension de la façon dont les différences héréditaires dans l'ADN peuvent contribuer à la maladie. risque et réponse médicamenteuse.

Sur les plus de 88 millions de sites variables identifiés, environ 12 millions avaient des variantes communes qui étaient probablement partagées par de nombreuses populations. L'étude a montré que la plus grande diversité génomique se trouve dans les populations africaines, ce qui est conforme aux preuves que les humains sont originaires d'Afrique et que les migrations en provenance d'Afrique ont établi d'autres populations dans le monde.

Les 26 populations étudiées comprenaient des groupes tels que les Esan au Nigeria, les Colombiens à Medellin, les populations ibériques de Colombie en Espagne, les Chinois Han à Pékin et les Tamouls sri-lankais au Royaume-Uni. Toutes les personnes étudiées pour le projet ont consenti à une large diffusion de leurs données, et les données peuvent être utilisées par des chercheurs du monde entier.

« Le projet 1000 génomes était un effort ambitieux et historiquement important qui a produit une ressource précieuse sur la variation génomique humaine », a déclaré Eric Green, M.D., Ph.D., directeur du NHGRI. « Les dernières données et connaissances ajoutent à une compréhension croissante des modèles de variation dans les génomes des individus et fournissent une base pour acquérir une meilleure compréhension de la génomique des maladies humaines. »

Ces rapports marquent le point culminant du projet 1000 Genomes, qui a trouvé plus de 99 pour cent des variantes du génome humain qui se produisent à une fréquence d'au moins 1 pour cent dans les populations étudiées.

"Quelque 88 millions de sites du génome diffèrent d'une personne à l'autre. Environ un quart de ces variantes sont courantes et se produisent dans de nombreuses ou dans toutes les populations, tandis qu'environ les trois quarts se produisent chez seulement 1% des personnes ou sont encore plus rares", a déclaré Lisa Brooks, Ph.D., directeur de programme dans le programme de variation génomique du NHGRI. "Les données du projet 1000 Genomes sont une ressource pour toute étude dans laquelle les scientifiques recherchent des contributions génomiques à la maladie, y compris l'étude de variantes communes et rares."

L'une des utilisations les plus immédiates des données du projet 1000 génomes concerne les études d'association pangénomique (GWAS), qui comparent les génomes de personnes avec et sans maladie pour rechercher des régions du génome contenant des variantes génomiques associées à cette maladie. De telles études trouvent généralement plusieurs régions génomiques associées à une maladie et de nombreuses variantes dans chacune de ces régions. Les scientifiques peuvent désormais combiner les données GWAS avec les données plus détaillées du projet 1000 génomes pour se concentrer plus précisément sur les régions affectant la maladie. Au lieu de séquencer les génomes de toutes les personnes d'une étude, ce qui reste coûteux, les chercheurs peuvent utiliser les données du 1000 Genomes Project pour trouver la plupart des variantes dans les régions associées à la maladie.

"Lorsque le projet 1000 génomes a été lancé pour la première fois en 2008, on ne comprenait pas vraiment comment les variantes génomiques rares étaient distribuées parmi les populations du monde entier et leur relation avec d'autres variantes", a déclaré Adam Auton, Ph.D., l'étude principale. auteur principal et chercheur principal qui, jusqu'à récemment, était professeur adjoint de génétique à l'Albert Einstein College of Medicine à New York.

"Le projet a été un effort pour créer un ensemble de données de référence sur la variation génomique. Il nous renseigne vraiment sur la structure de la variation et de la diversité génomiques humaines", a déclaré le Dr Auton, qui travaille maintenant pour la société 23andMe à Mountain View, en Californie.

Dans un article d'accompagnement en La nature, les scientifiques ont examiné les différences dans la structure du génome dans les 2 504 échantillons. Ils ont trouvé près de 69 000 différences, appelées variantes structurelles. Ces différences génomiques, dont beaucoup ont affecté les gènes, comprennent des délétions (perte d'ADN), des insertions (ADN ajouté) et des duplications (copies d'ADN supplémentaires). Les chercheurs ont créé une carte de huit classes de variantes structurelles qui contribuent potentiellement à la maladie.

"La variation structurelle est responsable d'un grand pourcentage de différences dans l'ADN parmi les génomes humains", a déclaré Jan Korbel, Ph.D., chef de groupe et chercheur du Conseil européen de la recherche dans l'unité de biologie du génome du Laboratoire européen de biologie moléculaire à Heidelberg, en Allemagne. . Le Dr Korbel est auteur principal et co-chercheur principal pour l'étude de variation structurelle. "Aucune étude n'a jamais examiné la variation structurelle génomique avec ce type de représentation large des populations à travers le monde."

Le Dr Korbel, le co-chercheur principal Evan Eichler, Ph.D., professeur de sciences du génome et chercheur au Howard Hughes Medical Institute de l'Université de Washington à Seattle, et leurs collègues ont découvert que les variantes structurelles étaient souvent plus compliquées qu'ils ne le pensaient à l'origine . Par exemple, la majorité des inversions, qui impliquent des séquences d'ADN changeant leur orientation dans le génome, se produisent fréquemment avec d'autres changements structurels.

À Gonçalo Abecasis, Ph.D., titulaire de la chaire de biostatistique à l'Université du Michigan à Ann Arbor et co-chercheur principal du principal La nature étude, la valeur du projet 1000 génomes s'étend bien au-delà des données. Les progrès dans le séquençage de l'ADN et la bioinformatique ont été essentiels à la réalisation du projet.

« Nous avons beaucoup appris sur la façon de faire de la génomique à grande échelle », a déclaré le Dr Abecasis. "Au cours du projet 1000 Genomes, nous avons développé de nouvelles méthodes améliorées pour le séquençage de l'ADN à grande échelle, l'analyse et l'interprétation des informations génomiques, en plus de la façon de stocker autant de données. Nous avons appris à faire des études génomiques de qualité dans différents contextes et parties du monde.

"Le projet 1000 Genomes a jeté les bases pour que d'autres répondent à des questions vraiment intéressantes", a déclaré le Dr Auton. "Tout le monde veut maintenant savoir ce que ces variantes nous disent sur les maladies humaines."

Un certain nombre d'organisations, d'agences et d'autres instituts du NIH, notamment le National Cancer Institute, le National Heart, Lung, and Blood Institute et le National Institute of General Medical Sciences, ont également financé cette recherche.


Résumé de l'auteur

Comprendre le processus de mutation est important, non seulement d'un point de vue mécanique, mais aussi parce qu'il a des implications pour l'analyse de l'évolution des séquences et l'inférence génétique des populations. Le taux de mutation est connu pour différer entre les sites du génome humain. L'exemple le plus dramatique de ceci est quand un C est suivi par G, les nucléotides C et G ont un taux de mutation qui est entre 10 et 20 fois plus élevé que le taux sur d'autres sites. De plus, est-il connu que le taux de mutation peut être influencé par les nucléotides flanquant le site. Ici, nous montrons qu'il existe également une variation très substantielle du taux de mutation qui n'est pas associée aux nucléotides flanquants ou à l'effet CpG. Bien que cette variation ne dépende pas des nucléotides adjacents, il existe des modèles non aléatoires de nucléotides entourant les sites qui semblent être hypermutables, ce qui suggère qu'il existe des effets de contexte complexes qui influencent le taux de mutation.

Citation: Hodgkinson A, Ladoukakis E, Eyre-Walker A (2009) Variation cryptique du taux de mutation humaine. PLoS Biol 7(2) : e1000027. https://doi.org/10.1371/journal.pbio.1000027

Éditeur académique : Nick H. Barton, Université d'Édimbourg, Royaume-Uni

A reçu: 8 juillet 2008 Accepté: 12 décembre 2008 Publié : 3 février 2009

Droits d'auteur: © 2009 Hodgkinson et al. Il s'agit d'un article en libre accès distribué selon les termes de la licence d'attribution Creative Commons, qui permet une utilisation, une distribution et une reproduction sans restriction sur n'importe quel support, à condition que l'auteur et la source d'origine soient crédités.

Le financement: AH et AEW ont été financés par le Conseil de recherche en biotechnologie et sciences biologiques, EL et AEW par la Communauté européenne et AEW par le National Evolutionary Synthesis Center.

Intérêts concurrents : Les auteurs ont déclaré qu'ils n'existaient pas de conflit d'intérêts.

Abréviations : Mya, il y a des millions d'années SNP, polymorphisme mononucléotidique


Catégorisation de la population mondiale

De nouvelles données sur la variation génétique humaine ont relancé le débat sur une éventuelle base biologique pour la catégorisation des humains en races. La majeure partie de la controverse porte sur la question de savoir comment interpréter les données génétiques et si les conclusions fondées sur celles-ci sont fondées. Certains chercheurs soutiennent que la race auto-identifiée peut être utilisée comme indicateur d'ascendance géographique pour certains risques pour la santé et certains médicaments.

Bien que les différences génétiques entre les groupes humains soient relativement faibles, ces différences dans certains gènes tels que duffy, ABCC11, SLC24A5, appelés marqueurs informatifs sur l'ascendance (AIM), peuvent néanmoins être utilisées pour situer de manière fiable de nombreux individus dans de larges groupes géographiques. Par exemple, des analyses informatiques de centaines de loci polymorphes échantillonnés dans des populations réparties à l'échelle mondiale ont révélé l'existence d'un regroupement génétique qui est à peu près associé à des groupes qui ont historiquement occupé de grandes régions continentales et sous-continentales (Rosenberg et al. 2002 Bamshad et al. 2003).

Certains commentateurs ont soutenu que ces modèles de variation fournissent une justification biologique à l'utilisation des catégories raciales traditionnelles. Ils soutiennent que les regroupements continentaux correspondent à peu près à la division des êtres humains en Africains subsahariens Européens, Asiatiques occidentaux, Asiatiques centraux, Asiatiques du Sud et Africains du Nord Asiatiques de l'Est, Asiatiques du Sud-Est, Polynésiens et Amérindiens et autres habitants de l'Océanie (Mélanésiens, Micronésiens & Aborigènes australiens) (Risch et al. 2002). D'autres observateurs ne sont pas d'accord, affirmant que les mêmes données sapent les notions traditionnelles de groupes raciaux (King et Motulsky 2002 Calafell 2003 Tishkoff et Kidd 2004 [8] ). Ils soulignent, par exemple, que les principales populations considérées comme des races ou des sous-groupes au sein des races ne forment pas nécessairement leurs propres groupes.

De plus, comme la variation génétique humaine est clinale, de nombreux individus s'associent à deux ou plusieurs groupes continentaux. Ainsi, l'« ascendance biogéographique » génétiquement attribuée à une personne donnée sera généralement largement distribuée et s'accompagnera d'incertitudes importantes (Pfaff et al.2004).

Dans de nombreuses régions du monde, les groupes se sont mélangés de telle sorte que de nombreux individus ont des ancêtres relativement récents provenant de régions très éloignées. Bien que les analyses génétiques d'un grand nombre de loci puissent produire des estimations du pourcentage d'ancêtres d'une personne provenant de diverses populations continentales (Shriver et al. 2003 Bamshad et al. 2004), ces estimations peuvent supposer une fausse distinction des populations parentales, puisque les groupes humains ont échangé des partenaires d'échelle locale à continentale à travers l'histoire (Cavalli-Sforza et al. 1994 Hoerder 2002). Même avec un grand nombre de marqueurs, les informations pour estimer les proportions de mélange d'individus ou de groupes sont limitées, et les estimations auront généralement de larges intervalles de confiance (Pfaff et al.2004).

Clustering génétique

Les données génétiques peuvent être utilisées pour déduire la structure de la population et attribuer des individus à des groupes qui correspondent souvent à leur ascendance géographique auto-identifiée. Récemment, Lynn Jorde et Steven Wooding ont fait valoir que "l'analyse de nombreux loci donne maintenant des estimations raisonnablement précises de la similitude génétique entre les individus, plutôt que les populations. Le regroupement des individus est corrélé à l'origine géographique ou à l'ascendance." [7]

Anthropologie médico-légale

Les anthropologues médico-légaux peuvent déterminer l'ascendance géographique (c'est-à-dire asiatique, africaine ou européenne) à partir de restes squelettiques avec un degré élevé de précision en effectuant une analyse osseuse. [41] Des études ont montré que les méthodes de test individuelles telles que les mesures médio-faciales et les traits du fémur peuvent être précises à plus de 80% et, en combinaison, peuvent être très précises. Cependant, les squelettes d'individus d'ascendance mixte peuvent présenter des caractéristiques de plus d'un groupe ancestral.

Mélange

Le flux de gènes entre deux populations réduit la distance génétique moyenne entre les populations. Le mélange génétique est le résultat d'interactions entre des populations bien différenciées. La cartographie des mélanges est une technique utilisée pour étudier comment les variantes génétiques provoquent des différences dans les taux de maladie entre les populations. [9] Les populations de mélanges récentes qui retracent leur ascendance sur plusieurs continents sont bien adaptées pour identifier des gènes pour des traits et des maladies dont la prévalence diffère entre les populations parentales. Les populations afro-américaines ont fait l'objet de nombreuses études de cartographie génétique et de mélange des populations, y compris des études de traits génétiques complexes tels que le nombre de globules blancs, l'indice de masse corporelle, le cancer de la prostate et les maladies rénales. [9]

Une analyse des variations phénotypiques et génétiques incluant la couleur de la peau et le statut socio-économique a été réalisée dans la population du Cap-Vert qui a une histoire bien documentée de contacts entre Européens et Africains. Les études ont montré que le modèle de mélange dans cette population était biaisé en fonction du sexe et qu'il existe des interactions significatives entre le statut socio-économique et la couleur de la peau, indépendamment de la couleur de la peau et de l'ascendance. [9] Une autre étude montre un risque accru de complications de la maladie du greffon contre l'hôte après la transplantation en raison de variantes génétiques de l'antigène leucocytaire humain (HLA) et des protéines non-HLA. [9]


Arbre généalogique des primates

En raison de milliards d'années d'évolution, les humains partagent des gènes avec tous les organismes vivants. Le pourcentage de gènes ou d'ADN que les organismes partagent enregistre leurs similitudes. Nous partageons plus de gènes avec des organismes qui nous sont plus étroitement liés.

Les humains appartiennent au groupe biologique connu sous le nom de primates et sont classés avec les grands singes, l'un des principaux groupes de l'arbre évolutif des primates. Outre les similitudes d'anatomie et de comportement, notre étroite parenté biologique avec d'autres espèces de primates est indiquée par des preuves ADN. Cela confirme que nos plus proches parents biologiques vivants sont les chimpanzés et les bonobos, avec lesquels nous partageons de nombreux traits. Mais nous n'avons pas évolué directement à partir des primates vivant aujourd'hui.

L'ADN montre également que notre espèce et nos chimpanzés ont divergé d'une espèce ancêtre commune qui vivait il y a entre 8 et 6 millions d'années. Le dernier ancêtre commun des singes et des singes a vécu il y a environ 25 millions d'années.


Le génome humain

Qu'est-ce qui rend chacun de nous unique ? On pourrait soutenir que l'environnement joue un rôle, et il le fait dans une certaine mesure. Mais la plupart conviendraient que vos parents ont quelque chose à voir avec votre unicité. En fait, c'est notre gènes qui rendent chacun de nous unique &ndash ou du moins génétiquement unique. Nous avons tous les gènes qui nous rendent humains : les gènes de la peau et des os, des yeux et des oreilles, des doigts et des orteils, etc. Cependant, nous avons tous des couleurs de peau différentes, des tailles d'os différentes, des couleurs d'yeux différentes et des formes d'oreilles différentes. En fait, même si nous avons les mêmes gènes, les produits de ces gènes fonctionnent un peu différemment chez la plupart d'entre nous. Et c'est ce qui nous rend unique.

Les génome humain est le génome - tout l'ADN - de Homo sapiens. Les humains possèdent environ 3 milliards de bases d'informations, réparties en environ 20 000 à 22 000 gènes, qui sont répartis entre des séquences non codantes et répartis entre 24 chromosomes distincts (22autosomes plus les X et Y chromosomes sexuels) (au dessous de). Le génome est l'ensemble des informations héréditaires codées dans l'ADN, y compris les gènes et les séquences non codantes.

Génome humain, chromosomes et gènes. Chaque chromosome du génome humain contient de nombreux gènes ainsi que des régions intergéniques (entre gènes) non codantes. Chaque paire de chromosomes est représentée ici dans une couleur différente.

Grace à Projet du génome humain, les scientifiques connaissent désormais la séquence d'ADN de l'ensemble du génome humain. Le Human Genome Project est un projet international qui inclut des scientifiques du monde entier. Cela a commencé en 1990, et en 2003, les scientifiques avaient séquencé les 3 milliards de paires de bases d'ADN humain. Maintenant, ils essaient d'identifier tous les gènes de la séquence. Le Human Genome Project a produit une séquence de référence du génome humain. Le génome humain est constitué de protéines codant exons, associée introns et des séquences régulatrices, des gènes qui codent pour d'autres molécules d'ARN, et d'autres séquences d'ADN (parfois appelées ADN "junk"), qui sont des régions dans lesquelles aucune fonction n'a encore été identifiée.

Vous pouvez regarder une vidéo sur le Human Genome Project et comment il a déchiffré le "code de la vie" sur ce lien : http://www.pbs.org/wgbh/nova/genome/program.html.

Notre moi moléculaire La vidéo traite du génome humain et est disponible sur http://www.genome.gov/25520211 ou http://www.youtube.com/watch?v=_EK3g6px7Ik.Génome, débloquer le code de la vie est l'exposition du Musée national d'histoire naturelle du Smithsonian sur le génome humain. Voir http://unlockinglifescode.org pour visiter l'exposition.

ENCODE : L'Encyclopédie des éléments de l'ADN

En septembre 2012, ENCODE, Le Encyclopedia oF N / A Eéléments, a été annoncé. ENCODE était un projet colossal, impliquant plus de 440 scientifiques dans 32 laboratoires du monde entier, dont le but était de comprendre le génome humain. On pensait qu'environ 80% du génome humain était de l'ADN « poubelle ». ENCODE a établi que ce n'est pas vrai. Aujourd'hui, on pense qu'environ 80% du génome est actif. En fait, une grande partie du génome humain est constituée de séquences régulatrices, d'interrupteurs marche/arrêt qui indiquent à nos gènes quoi faire et quand le faire. Le Dr Eric Green, directeur de l'Institut national de recherche sur le génome humain des National Institutes of Health qui a organisé ce projet, déclare : « C'est cette incroyable chorégraphie en cours, d'un nombre modeste de gènes et d'un nombre immense de . commutateurs qui chorégraphient la façon dont ces gènes sont utilisés.

On pense maintenant qu'au moins les trois quarts du génome sont impliqués dans la fabrication de l'ARN, et la plupart de cet ARN semble aider à réguler l'activité des gènes. Les scientifiques ont également identifié environ 4 millions de sites où les protéines se lient à l'ADN et agissent à titre de régulation. Ces nouvelles découvertes démontrent que le génome humain possède des contrôles remarquables, précis et complexes sur l'expression de l'information génétique au sein d'une cellule.


Quelle est la variation du comportement humain due à la variation de nos gènes ? Réponse : un peu.

Les seules personnes qui prétendent que la variation comportementale entre les personnes n'a rien à voir avec leurs gènes sont des idéologues : de « purs slaters blancs ». Sur la base d'études sur d'autres espèces, nous savons que pratiquement toutes les études sur ces traits morphologiques, physiologiques ou comportementaux montrent qu'une partie ou même une grande partie de la variation d'une population est basée sur la variation des gènes de différents individus. (Je ne connais que trois études sur des animaux, sur des milliers réalisées, qui n'ont pas réussi à trouver une base génétique pour la variation entre les traits analysés. Deux des trois études étaient les miennes, et toutes étaient sur directionnel asymétrie : essayer de voir s'il y a une différence génétique pour, disons, avoir plus de poils sur le côté droit que sur le côté gauche d'une mouche.)

Alors que les humains ont une source supplémentaire de variation interindividuelle – la culture – il existe des moyens de contourner l'héritage culturel pour voir dans quelle mesure la variation humaine est basée sur la variation génétique. Il existe plusieurs façons de déterminer et de mesurer la contribution de la variation génétique à la variation entre les individus.

Mais d'abord, apprenons le terme technique en cause : héritabilité. L'héritabilité est une mesure qui va de zéro à un (ou de 0 % à 100 %) et vous indique quelle part de la variation observée parmi les individus d'une population est basée sur la variation génétique parmi ces individus. Plus l'héritabilité est élevée, plus il y a de détermination génétique de variation dans le trait. Ainsi, par exemple, si l'héritabilité de la taille humaine pour les femelles est de 0,7 (ou 70%), cela signifie que si vous mesurez la variation dans une population pour la taille des femmes (la variation est classiquement estimée en calculant la variance-dénotée par ² ou s² - alors de la variance totale pour la hauteur, 70% de cette estimation est due à la variation des gènes individuels. Dans ce cas, il existe un degré élevé de contrôle génétique de la variation de hauteur. (Ceci est proche du chiffre réel pour la taille féminine.) De manière confuse, le symbole de l'héritabilité est h².

Maintenant, c'est un peu plus compliqué que cela, car l'héritabilité n'incorpore que ce que nous appelons le additif variance génétique plutôt que d'autres types de variance génétique (généralement mineure). Et bien sûr, il existe d'autres sources évidentes de variation de la taille, principalement la nutrition et la santé. Plus cet environnement contribue aux différences entre les individus dans un trait, plus l'héritabilité génétique est faible. Ainsi, par exemple, l'héritabilité de la couleur des cheveux chez les adultes a été réduite par l'introduction d'une source de variation environnementale : les teintures capillaires. Moins de variation de la couleur des cheveux que nous voyons, par rapport à, disons, il y a 200 ans, est due à la variation génétique.

Il est important de saisir plusieurs mises en garde concernant l'héritabilité. D'abord, c'est un chiffre qui s'applique à une population métissée à la fois- le moment de la mesure. Vous ne pouvez pas appliquer l'héritabilité d'un groupe à un groupe différent qui peut avoir des gènes différents et, surtout, différentes quantités et sources de variation environnementale qui affectent un trait. Une population en famine, par exemple, peut présenter une héritabilité de la taille plus faible parce que la taille des individus peut être altérée par des quantités de nourriture très différentes qu'ils reçoivent.

Deuxièmement, l'héritabilité en dit très peu sur à quel point un trait peut être modifié, car la génétique n'est pas le destin. Oui, l'héritabilité de la taille peut être de 70 %, mais cela ne signifie pas que nous ne pouvons pas rendre les gens plus grands ou plus petits en leur donnant beaucoup de bons aliments, en leur injectant des hormones de croissance ou en les affamant. Lorsque les gens s'opposent à la mesure de l'héritabilité du QI, par exemple, ils pensent souvent à tort que parce que le QI a une héritabilité importante, ce qui est le cas, il ne peut donc pas être modifié. Mais c'est faux, il existe de nombreuses interventions possibles qui peuvent affecter le QI.

Troisièmement, comme indiqué ci-dessus, la mesure de l'héritabilité au sein d'un groupe nous en dit très peu, voire rien, sur la base génétique de la différence. parmi groupes. C'est parce qu'il peut y avoir des différences environnementales entre les groupes qui affectent le personnage de manière profonde et rendent les extrapolations d'un groupe à un autre inutiles. Vous ne pouvez pas conclure, par exemple, que des mesures de comportement, de mentalité, etc., dans une population ou un groupe ethnique, même si les héritabilités sont importantes au sein de cette population, doivent donc signifier que les grandes différences entre les groupes doivent reposer sur des différences génétiques entre ces groupes. L'héritabilité de la taille dans la population japonaise juste après la Seconde Guerre mondiale, par exemple, était probablement considérablement inférieure à 70% en raison de la grande variation de la nutrition chez les Japonais. Ainsi, vous ne pouvez pas conclure que leur taille plus petite que celle des Américains à l'époque était basée sur des différences génétiques. En fait, la taille moyenne des Japonais a augmenté de trois à quatre pouces en une trentaine d'années ! Voilà pour l'idée qu'une héritabilité substantielle pour un trait dans un groupe signifie que ce trait ne peut pas être modifié !

Quatrièmement, il existe une idée fausse commune selon laquelle l'héritabilité vous dit "combien de ton la taille (ou le poids, ou le QI) est génétique”. Une héritabilité de 80 % pour la taille ne signifie pas que, si vous mesurez cinq pieds, quatre pieds proviennent des gènes et un pied de l'environnement. Cette conclusion n'a pas de sens biologique puisque la taille d'un individu implique une interaction entre les gènes et l'environnement. La seule façon sensée d'interpréter l'héritabilité est de dire qu'elle nous dit dans quelle mesure la VARIATION que nous voyons d'un individu à l'autre au sein d'une population est basée sur des différences dans leurs gènes (ou plutôt, des formes de leurs gènes : différents « allèles » ).

Comment déterminer l'héritabilité ? Il y a plusieurs façons. Dans les espèces comme les plantes et les animaux dans lesquelles nous pouvons effectuer une sélection artificielle, nous pouvons estimer l'héritabilité en voyant dans quelle mesure une population répond à la sélection artificielle pour le trait. Plus la réponse est grande, plus l'héritabilité est élevée. Il y a une équation qui vous dit ceci : la réponse à la sélection artificielle est à peu près égale à la force de la sélection (quelle différence y a-t-il entre le trait moyen du groupe que vous choisissez pour la reproduction et celui de la population en général) multiplié par le héritabilité. Si l'héritabilité de la longueur tête-à-queue chez les porcs est de 50 % et que vous choisissez pour élever un groupe de porcs dont la taille moyenne est supérieure de 60 cm à celle de la population, vous vous attendez à ce que la prochaine génération de porcs soit un pied de plus que la population d'origine (0,5 X 2 pieds). Donc, si vous savez à quel point vous sélectionnez avec force, ce que vous faites et quelle est la réponse de la prochaine génération, vous pouvez recalculer pour estimer l'héritabilité du trait que vous avez sélectionné.

La sélection artificielle n'est pas pratiquée chez l'homme, bien sûr, nous déterminons donc généralement l'héritabilité en examinant la corrélation entre les parents, y compris la corrélation parent-enfant et la corrélation entre les jumeaux. La corrélation parent-enfant est risquée s'il existe une composante environnementale du trait qui peut également être héritée. Il me semble me rappeler que les deux traits les plus héritables chez l'homme sont la religion et la richesse, et cela est dû à la transmission de ces traits entre les générations via la culture, et non via les gènes ! Chez les animaux qui n'ont pas de culture transmissible, comme les mouches des fruits, on peut cependant faire ce genre d'études.

Les chercheurs sur les humains utilisent souvent des études sur les jumeaux, comparant la similitude entre des jumeaux identiques (qui ont les mêmes gènes) avec la similitude entre des jumeaux fraternels, qui partagent la moitié de leurs gènes. Nous savons tous que les jumeaux identiques sont plus similaires pour pratiquement tous les traits comportementaux et morphologiques que les jumeaux fraternels (il suffit de les regarder !), ce qui implique que les gènes jouent un rôle important dans ces traits. Vous pouvez en fait estimer l'héritabilité des traits en examinant la différence dans les corrélations entre jumeaux identiques et jumeaux fraternels (vous avez besoin d'un échantillon de jumeaux de taille décente pour ce faire).

Il y a aussi une mise en garde ici, cependant. Les jumeaux identiques partagent souvent plus environnemental points communs que les jumeaux fraternels. Ils peuvent être traités de la même manière, habillés de la même manière, élevés et éduqués de la même manière que les jumeaux fraternels. Ainsi, une similitude accrue de jumeaux identiques ne reflète pas nécessairement l'identité de leurs gènes, mais une plus grande similitude de leurs environnements. Au moins pour l'apparence physique, cependant, cela ne semble pas être le cas : vous ne pouvez pas socialiser des jumeaux identiques pour qu'ils se ressemblent davantage que des jumeaux fraternels !

Une façon de contourner la similitude environnementale possible est de comparer des jumeaux fraternels élevés ensemble avec des jumeaux identiques séparés à la naissance et élevés séparément. Si ces derniers présentent encore des similitudes sensiblement plus grandes malgré leurs environnements différents, c'est un signe certain que les traits mesurés ont des héritabilités substantielles. Cependant, comme vous pouvez l'imaginer, il n'y a pas de gros échantillons de jumeaux identiques séparés à la naissance.

Enfin, nous pouvons mesurer les héritabilités à l'aide de l'ADN, par le biais d'études d'association pangénomiques. C'est plus compliqué, mais cela implique de trouver les régions de l'ADN associées à la variation d'un trait (comme la taille), puis d'additionner les petits effets de toutes les régions connues pour voir dans quelle mesure ces morceaux connus du génome peuvent contribuer à la variation entre personnes. Les héritabilités ainsi mesurées sont invariablement inférieures à celles mesurées par corrélations ou sélection, car ces deux dernières méthodes prennent en compte erégion même du génome contribuant à la variation. La variation de la plupart des traits comportementaux est due à de nombreux gènes à très faible effet, et il est presque impossible de tous les trouver par cartographie d'association.

Tout ceci est un très long prologue à une très courte figure que je vais vous montrer—une figure qui vient de ce nouvel article en Nature Comportement Humain. Il résume les données d'héritabilité pour un certain nombre de traits comportementaux, en comparant les héritabilités des études de jumeaux à celles des études d'association. Cliquez sur la capture d'écran pour voir le document, et j'ai mis la référence complète en bas :

Et voici la figure 2 montrant les héritabilités mesurées dans les deux sens. Les lignes et points bleus donnent des données d'études de jumeaux ou de familles, les lignes oranges et les points de cartographie d'association. Vous pouvez voir que les études d'association produisent, comme prévu, des estimations d'héritabilité inférieures, mais je m'attends à ce que les vraies valeurs soient plus proches des données de l'étude familiale). 26 traits comportementaux ont été mesurés, allant du niveau d'instruction, du QI chez les enfants et les adultes, la quantité d'alcool et de tabac, la névrose, aux troubles mentaux comme la schizophrénie.

Cliquez sur la figure pour l'agrandir.

The values in the colored triangle to the left are the “genetic correlations” between traits, which tells us the degree to which pairs of traits are affected by variation in the same genes. We need not concern ourselves with that.

For the moment, look at the lengths of the blue bars to the right, which are probably pretty close to accurate estimates of heritabilities. And for most traits they are pretty big, with over 25% of the variation in a trait due to variation in the genes within that population. For some traits, like adult IQ, number of sexual partners, alcohol dependence, autism spectrum placement, and schizophrenia, heritabilities are over 50%

What all this does is refute the “blank slate” view that the differences between people in their behavior is completely due to culture and socialization. It also shows that a substantial portion, however, is due to other sources of variation: developmental, post-birth environmental differences, and so on. It also shows that you could select on any of these traits and get a response, increasing, for instance, the age of first intercourse (Christians take note!) or reducing alcohol dependence. NOTE: I AM NOT SUGGESTING THAT WE SELECT ON THESE TRAITS!


64 human genomes as new reference for global genetic diversity

In 2001, the International Human Genome Sequencing Consortium announced the first draft of the human genome reference sequence. The Human Genome Project, as it was called, had taken more than eleven years of work and involved more than 1000 scientists from 40 countries. This reference, however, did not represent a single individual but instead is a composite of humans that could not accurately capture the complexity of human genetic variation.

Building on this, scientists have carried out many sequencing projects over the last 20 years to identify and catalog genetic differences between an individual and the reference genome. Those differences usually focused on small single base changes and missed larger genetic alterations. Current technologies now are beginning to detect and characterize larger differences - called structural variants - such as insertions of several hundred letters. Structural variants are more likely than smaller genetic differences to interfere with gene function.

An international research team has now published an article in Science announcing a new, considerably more comprehensive reference dataset obtained using a combination of advanced sequencing and mapping technologies. The new reference dataset reflects 64 assembled human genomes, representing 25 different human populations from across the globe. Importantly, each of the genomes was assembled without guidance from the first human genome and as a result better captures genetic differences from different human populations. The study was led by scientists from the European Molecular Biology Laboratory Heidelberg (EMBL), the Heinrich Heine University Düsseldorf (HHU), The Jackson Laboratory for Genomic Medicine in Farmington, Conn. (JAX), and the University of Washington in Seattle (UW).

"With these new reference data, genetic differences can be studied with unprecedented accuracy against the background of global genetic variation, which facilitates the biomedical evaluation of genetic variants carried by an individual," emphasizes the co-first author of the study, Dr. Peter Ebert from the Institute of Medical Biometry and Bioinformatics at HHU. The distribution of genetic variants can differ substantially between population groups as a result of spontaneous and continuously occurring changes in the genetic material. If such a mutation is passed on over many generations, it can become a genetic variant specific to that population.

The new reference data provide an important basis for including the full spectrum of genetic variants in so-called genome-wide association studies. The aim is to estimate the individual risk of developing certain diseases such as cancer and to understand the underlying molecular mechanisms. This, in turn, can be used as a basis for more targeted therapies and preventative medicine.

This work might enable further applications in precision medicine. Drug efficacy, for example, can vary between individuals based on their genomes. The new reference data now represent the full range of different genetic variant types and incorporates human genomes of great diversity. Therefore, this new resource might contribute to developing novel approaches in personalized medicine, where the selection of therapies is tailored to a patient's individual genetic background.

This study builds on a new method published by these researchers last year in Biotechnologie naturelle) to accurately reconstruct the two components of a person's genome - one inherited from a person's father, one from a person's mother. When assembling a person's genome, this method eliminates the potential biases that could result from comparisons with an imperfect reference genome.

Peter Ebert*, Peter A. Audano*, Qihui Zhu*, Bernardo Rodriguez-Martin*, David Porubsky, Marc Jan Bonder, Arvis Sulovari, Jana Ebler, Weichen Zhou, Rebecca Serra Mari, Feyza Yilmaz, Xuefang Zhao, PingHsun Hsieh, Joyce Lee, Sushant Kumar, Jiadong Lin, Tobias Rausch, Yu Chen, Jingwen Ren, Martin Santamarina, Wolfram Höps, Hufsah Ashraf, Nelson T. Chuang, Xiaofei Yang, Katherine M. Munson, Alexandra P. Lewis, Susan Fairley, Luke J. Tallon, Wayne E. Clarke, Anna O. Basile, Marta Byrska-Bishop, Andre Corvelo, Uday S. Evani, Tsung-Yu Lu, Mark J.P. Chaisson, Junjie Chen, Chong Li, Harrison Brand, Aaron M. Wenger, Maryam Ghareghani, William T. Harvey, Benjamin Raeder, Patrick Hasenfeld, Allison A. Regier, Haley J. Abel, Ira M. Hall, Paul Flicek, Oliver Stegle, Mark B. Gerstein, Jose M.C. Tubio, Zepeng Mu, Yang I. Li, Xinghua Shi, Alex R. Hastie, Kai Ye, Zechen Chong, Ashley D. Sanders, Michael C. Zody, Michael E. Talkowski, Ryan E. Mills, Scott E. Devine, Charles Lee#, Jan O. Korbel#, Tobias Marschall#, Evan E. Eichler#, Haplotype-resolved diverse human genomes and integrated analysis of structural variation, Science 2021
*Co-first authors #Co-senior and co-corresponding authors

"For each human individual that participated in the study, we identified not one but two genomes - one for each set of chromosomes," says Jan Korbel, Ph.D., Head of Data Science at the European Molecular Biology Laboratory (EMBL) in Heidelberg who led the research at EMBL. Korbel added: "Humans have two sets of chromosomes which they receive from their parents. Previously we could not distinguish whether genetic variation came from one chromosome set or the other, and we were now able to solve this thanks to advances made by the Human Genome Structural Variation Consortium. It represents a remarkable achievement for the discovery of genetic variation in humans, which can now be studied much more comprehensively, leading the way to better find disease-causing genes."

"These genomes will pave the way to a new wave of scientific discoveries about the biology of the human genome and the connection between genetic variation and disease", says Bernardo Rodriguez-Martin, researcher at EMBL and co-first author. Rodriguez-Martin added: "As an example, we were able to estimate the age of highly mutagenic L1 repeats. Very surprisingly, although these sequences originated up to 3 Million of years ago, they continue to mutate the human genome frequently, which occasionally leads to diseases such as cancer."

"Just a few years ago, I would not have imagined that resolving genomes to this completeness would become possible so fast. This was enabled by exciting advances both of biotechnological and computational methods." says Dr. Peter Ebert, co-first author and computational biologist at Heinrich Heine University Düsseldorf, Germany. "Great to see this technology applied to a diversity panel of human genomes. These genome sequences will be an important resource for fundamental research and clinical genomics going forward."

Senior author Prof. Dr. Tobias Marschall, who led the research at HHU, added that "it was especially exciting to see that these new genome sequences enable a much more detailed analysis of data from standard sequencing technologies, which are routinely applied to millions of genomes by researchers and clinicians across the globe." He believes that "future studies to find associations between genetic variants and disease susceptibility will clearly benefit from this new approach."

"The first human genome sequence was a huge step forward, but was incomplete," said Charles Lee, Ph.D., FACMG, director and professor, The Jackson Laboratory for Genomic Medicine. "In addition to single base variation, we now know that structural variants also contribute very substantially to genomic differences between individuals. Our work provides a far more thorough and accurate window into that genomic variation across individuals and populations, and it represents an incredibly valuable new resource for the research community."

"Capturing the full spectrum of structural variation found in human genomes is vital for clinical applications," says Qihui Zhu, Ph.D., computational scientist. "These variants affect gene function and can contribute to diseases, drug response differences, and more. Knowing how they differ across individuals and across populations is needed to implement more effective genomic medicine."

"Each of these individual genomes is being resolved more completely for a fraction of the price of the first human genome" commented senior author, Evan Eichler, Professor of Genome Sciences, University of Washington School Medicine who was also a member of the original Human Genome Project. "We are discovering remarkable differences in genomic organization which have been missed until now, understanding these differences will enhance our ability to make genetic discoveries related to health and disease especially in groups that have been traditionally under-served by genomics research".

Peter Audano, co-first author, University of Washington School Medicine, adds, "the technology we have today can see into blindspots that have hidden information about diseases and our history. With these advances, we have discovered more than 100,000 structural variants, many of which are novel and affect genes or gene regulatory elements."

EMBL is Europe's flagship laboratory for the life sciences. Established in 1974 as an intergovernmental organisation, EMBL is supported by 27 member states, 2 prospective member states and 2 associate member states.

EMBL performs fundamental research in molecular biology, studying the story of life. The institute offers services to the scientific community trains the next generation of scientists and strives to integrate the life sciences across Europe.

EMBL is international, innovative and interdisciplinary. Its more than 1800 staff, from over 80 countries, operate across six sites in Barcelona (Spain), Grenoble (France), Hamburg (Germany), Heidelberg (Germany), Hinxton (UK) and Rome (Italy). EMBL scientists work in independent groups and conduct research and offer services in all areas of molecular biology.

EMBL research drives the development of new technology and methods in the life sciences. The institute works to transfer this knowledge for the benefit of society.
https:/ / www. embl. de/

Heinrich Heine University Düsseldorf is one of the younger higher education institutions in the state of North Rhine-Westphalia - founded in 1965. Since 1988 our university has carried the name of one of the city's finest sons. Today around 35,000 students study at a modern campus under conditions ideally suited to academic life.

As a campus university where everything is close together, all buildings including the University Hospital and the specialised libraries are easily reachable. Our university departments enjoy an excellent reputation due to an exceptionally high number of collaborative research centres. Moreover, the state capital Düsseldorf provides an attractive environment with a high quality of life.
https:/ / www. hhu. de/ en/

About The Jackson Laboratory

The Jackson Laboratory is an independent, nonprofit biomedical research institution with more than 2,300 employees. Headquartered in Bar Harbor, Maine, it has a National Cancer Institute-designated Cancer Center, a genomic medicine institute in Farmington, Conn., and facilities in Ellsworth and Augusta, Maine, in Sacramento, Calif., and in Beijing and Shanghai, China. Its mission is to discover precise genomic solutions for disease and empower the global biomedical community in the shared quest to improve human health. For more information, please visit http://www. jax. org.

Clause de non-responsabilité: AAAS et EurekAlert ! ne sont pas responsables de l'exactitude des communiqués de presse publiés sur EurekAlert! par les institutions contributrices ou pour l'utilisation de toute information via le système EurekAlert.


Human Genetics: A Look in the Mirror

Who are we? Where did we come from? How did we get here? Throughout the ages, humans have sought answers to these questions, pursuing wisdom through religion, philosophy, and eventually science. Evolutionary analyses published by Genome Biology and Evolution (GBE) allow us to peer into the mirror and better understand ourselves as a species, bringing us closer than ever to uncovering the answers to these long-held questions.

Taking over a decade to complete, the original Human Genome Project cost nearly $3 billion and involved the collective effort of hundreds of scientists. Since then, advances in sequencing technology have resulted in an explosion in human genetics and genomics research, with an estimated one million human genomes sequenced to date. Although this wealth of data has the potential to answer some of our most fundamental questions, unlocking its mysteries has necessitated the invention of new analytic and computational methods and the integration of techniques and ideas from diverse biological sciences, including physiology, anatomy, medicine, population genetics, bioinformatics, and computational, molecular, and evolutionary biology.

To aid in this challenge, since its first issue in 2009, GBE has sought to play a key role in this endeavor by publishing original research articles, letters, reviews, and commentaries that contribute to the rapidly growing body of literature on this topic and drive innovation in this field. Our virtual issue on human genetics highlights some of the most exciting research published in the journal within the last year and a half, demonstrating the wide variety of evolutionary approaches to this avenue of research as well as a number of fascinating insights into our own biology.

A key area of investigation involves identifying ways in which humans differ from other primates—in other words, what makes us human? Several studies published over the last 18 months suggest that part of the answer may be found in transcriptional regulation and changes in gene expression. Edsall et al. (2019) evaluated differences in chromatin accessibility, which impacts access of the transcriptional machinery to the DNA, across five primates including humans. They found high levels of differentiation across species, as well as classes of sites that differed based on selection, genomic location, and cell-type specificity. More specifically, Swain-Lenz et al. (2019) found that differences in chromatin accessibility near genes involved in lipid metabolism may provide a mechanistic explanation for the higher levels of body fat observed in humans compared with other primates. Arakawa et al. (2019) showed that human-specific increases in the transcription of four structural protein genes may give rise to morphological features specific to human skin, including increased thickness and strength compared with the skin of other primates. Finally, a catalog of proteins involved in transcriptional regulation by Perdomo-Sabogal and Nowick (2019) showed that certain types of transcription factors are associated with genes under positive selection, including those associated with schizophrenia, eye development, and fertility in humans.

Another area of interest is the role of mutation in shaping the human genome and our evolutionary history. For example, there has been considerable debate over how much of the human genome is subject to natural selection. It has been argued that this fraction cannot be too large, or else humans would suffer a loss of fitness due to the number of deleterious mutations. However, Galeota-Sprung et al. (2020) countered this argument by showing that the mutational load would be tolerable even if much of the human genome were subject to selection. Additional analyses by Castellano et al. (2020) revealed how the recombination rate, gene density, and mutation rate interact to shape patterns of DNA diversity across humans and other closely related homininae. A study by Prendergast et al. (2019) further uncovered unique biases in mutations that occur at adjacent nucleotide sites in humans, suggesting the existence of distinct evolutionary forces acting on such sites and identifying differences in these forces across human populations.

A particularly fascinating topic in this field is concerned with investigating genetic differences between human populations and their association with the natural history of these groups. For example, Harris et al. (2019) found that the ancestors of Native Americans carried the ancestral, rather than the derived, version of an ancient polymorphism that predates the split with Neanderthals. This polymorphism encompasses the fatty acid desaturase genes, and thus those with Native American ancestry may be at risk for low levels of nutrients derived from dietary omega-3 and omega-6 fatty acids. Jonnalagadda et al. (2019) identified a number of alleles associated with iris color and skin pigmentation in South Asians, whereas Vicuña et al. (2019) discovered genetic variants that may have helped the Andean Native American ancestors of people living in the Atacama Desert in northern Chile to adapt to high arsenic levels in the water. Analysis of another desert-dwelling population by Eaaswarkhanth et al. (2020) showed evidence for positive selection of a genomic region encompassing the TNKS gene in Kuwaiti individuals. Because this gene influences metabolic traits and hypertension risk, selection for this haplotype may have provided an advantage to Kuwaiti ancestors living in the desert of the Arabian Peninsula but has health implications for their modern-day descendants.

Indeed, as revealed by these studies, one of the greatest potential benefits of this line of inquiry is the elucidation of new knowledge that informs our understanding of human health and disease. Reher et al. (2019) found that genes of the major histocompatibility complex, which helps the immune system recognize foreign substances, retain higher levels of diversity than other genes. This was true in both archaic and modern humans, even though archaic humans and Neanderthals had reduced levels of genetic diversity compared with modern humans. Lin and Gokcumen (2019) characterized fine-scale structural variation in the human genome and revealed hotspots that were associated with both adaptive and biomedically relevant variants. For example, they identified hotspots associated with alpha and beta hemoglobin gene clusters as well as idiopathic short stature. Finally, a study by Liu et al. (2019) of samples taken from within a single tumor of a patient with hepatocellular carcinoma showed that the mitochondrial genome was evolving neutrally, providing evidence that refutes the hypothesis that selection acts on mitochondrial DNA to promote tumor development.

Together, this selection of manuscripts highlights some of the latest findings and new approaches in the study of human genetics, a field that promises to help define who we are as a species and to reveal mysteries of human migration and adaptation that may otherwise have been lost to human history. GBE seeks to be a resource for this exciting area of research and will continue to publish new data that will help inform, challenge, and direct new lines of inquiry.


What Scientists Mean When They Say 'Race' Is Not Genetic

If a team of scientists in Philadelphia and New York have their way, using race to categorize groups of people in biological and genetic research will be forever discontinued.

The concept of race in such research is "problematic at best and harmful at worst," the researchers argued in a new paper published in the journal Science on Friday.

However, they also said that social scientists should continue to study race as a social construct to better understand the impact of racism on health.

So what does all this mean? HuffPost Science recently posed that question and others to the paper's co-author, Michael Yudell, who is associate professor and chair of community health and prevention at the Dornsife School of Public Health at Drexel University in Philadelphia.

Why is it problematic to view race as a biological concept?

For more than a century, natural and social scientists have been arguing about whether race is a useful classificatory tool in the biological sciences -- can it elucidate the relationship between humans and their evolutionary history, between humans and their health. In the wake of the U.S. Human Genome Project, the answer seemed to be a pretty resounding "no."

In 2004, for example, Francis Collins, then head of the National Human Genome Research Institute and now director of the National Institutes of Health, called race a “flawed” and “weak” concept and argued that science needed to move beyond race. Yet, as our paper highlights, the use of race persist in genetics, despite voices like Collins, like Craig Venter -- leaders in the field of genomics -- who have called on the field to move beyond it.

We believe it is time to revisit this century-long debate and bring biologists, social scientists and scholars from the humanities together in a constructive way to find better ways to study the ever-important subject of human diversity.

The race concept should be removed from genetics research for the following reasons: Genetic methods do not support the classification of humans into discrete races, [and] racial assumptions are not good biological guideposts. Races are not genetically homogenous and lack clear-cut genetic boundaries. And because of this, using race as a proxy to make clinical predictions is about probability.

Of course, medicine can be about best guesses, but are we serving patients well if medical decisions are made because a patient identifies as part of a certain racial group or are identified as belonging to a specific race? What if, for example, the probability is that if you are white you are 90 percent likely to have a beneficial or at least non-harmful reaction to a particular drug? That sounds pretty good, but what if you are that 1 in 10 that is likely to have a harmful reaction? That doesn’t sound so good, and that is the problem with most race-based predictions. They are best guesses for an individual.

We also believe that a variable so mired in historical and contemporary controversy has no place in modern genetics. Race has both scientific and social meanings that are impossible to tease apart, and we worry that using such a concept in modern genetics does not serve the field well.

Based on your research, what est race?

Genetics has long struggled with the definition of race. In the first decades of the 20th century, race was defined by discrete types, the belief that one member of a race was thought to share the same physical and social traits with other members of that race. In these early ideas about race, races generally mapped onto continental populations. Beginning in the 1930s, with the rise of modern population genetics and evolutionary biology, race was reimagined in the context of evolutionary biology and population genetics. Instead of racial groups being fixed between continents, the race concept was a way to understand the frequency of individual genes in different human populations.

In this way, race was a methodological tool that biologists could utilize to study human genetic diversity that did not reflect an underlying hierarchy between human populations. This was simply about gene frequencies between groups. And it is this understanding of race that is still largely the way modern science understands the term.

But the scientist who helped rethink race in the 1930s and 1940s -- the great evolutionary geneticist Theodosius Dobzhansky, a Russia-trained scientist who spent most of his career at Columbia University -- would later in his career voice concern that the use of the race concept in biology had "floundered in confusion and misunderstanding."

In the 1950s, Dobzhansky was moved by factors, both internal and external to science, to call into question the utility of racial classifications. The rise of the civil rights movement, the appropriation of biological conceptions of race to counter civil rights advances, and his own disputes with colleagues over the imprecise and sometimes inappropriate use of the term race led him to call on biologists to develop better methods for investigating human genetic diversity.

The problem today is that modern genetics is stuck in a paradox that reflects Dobzhansky’s own struggle with the race concept: both believing race to be a tool to elucidate human genetic diversity, and believing that race is a poorly defined marker of that diversity and an imprecise proxy for the relationship between ancestry and genetics. This paradox is rooted in the nature of the field. Like Dobzhansky, we and many others in genetics, anthropology and the social sciences have called on scientists to devise better methods to improve the study of human genetic diversity. The field is still trying to respond to Dobzhansky, and we hope that our paper spurs scientists to rethink the use of race in human genetic research.

Race also, of course, has social meanings. And by suggesting that race is not a useful tool for classifying humans, we do not mean to say that somehow race is not real. Race is, of course, real. We live in a country and a world where skin color has long been used as a way to systematize discrimination and brutality.

But that is not what we are arguing in this paper. We are arguing simply that race is not a useful tool to study human genetic diversity and that there is potential harm in doing so. We acknowledge in the paper that using race as a political or social category to study racism and its biological effects, although fraught with challenges, remains necessary.

For example, we need to continue to study how structural inequities and discrimination produce health disparities between groups. Your race can impact your health, but your genetics is not a good window into how race affects your health. This line of thinking goes all the way back to the sociologist and civil rights pioneer W.E.B. Du Bois. Du Bois was the first to synthesize data from anthropology and the social sciences to conclude, for example, that race-based disparities stem from social, not biological, inequalities.

How would you explain some of the differences that we see between various groups and the prevalence of certain genetic diseases, such as sickle cell anemia in the African-American community?

That’s a great example. Sickle cell is not an African-American or African disease, although it occurs in higher frequency in these populations. But this is not a racial difference it is a matter of ancestry, geography and evolution. Sickle-cell occurs in higher frequency in populations from regions of the world where malaria is or once was common, as sickle cell is a disease that is an evolutionary adaptation to exposure to malaria.

The sickle-cell trait is believed to be protective against malaria. Thus, sickle-cell disease is at its highest frequency in West Africans and people of West African descent. But this trait is not common in other regions of Africa, where malaria is not as prevalent. Therefore, it is not an "African" disease. Sickle cell also appears in other regions of the globe, in other human populations, including populations in the Mediterranean Basin, the Arabian Peninsula, and on the Indian subcontinent, where these populations also saw this adaptation to resist malaria.

How is race currently used in genetics research?

Race is used widely in human biological research and clinical practice to elucidate the relationship between our ancestry and our genes. In the laboratory, race can be used to investigate disease-causing genes within and between populations, and, more generally to classify groups in studies of human populations. Race is also used clinically to inform decisions about a patient’s risk for certain diseases and to help predict how one might metabolize drugs.

Some scientists have argued that relevant genetic information can be seen at the racial level that race is the best proxy we have for examining human genetic diversity. Other scientists have concluded race is neither a relevant nor accurate way to understand or map human genetic diversity. Finally, others have argued that race-based predictions in clinical settings, because of the heterogeneous nature of racial groups, are of questionable use. So, despite a widespread use of race in scientific and clinical research, race is the most controversial tool for making sense of human diversity that scientists have at their disposal.

We would prefer the field of genetics use concepts like ancestry instead of race in human studies. It is important to distinguish ancestry from race. Ancestry is a process-based concept that helps us understand the admixing events that lead to one’s existence. Ancestry is also a statement about an individual's relationship to other individuals in their genealogical history. Thus, it is a very personal understanding of one's genomic heritage.

Race, on the other hand, is a pattern-based concept that has led scientists and laypersons alike to draw conclusions about a hierarchical organization of humans, connecting an individual to a larger, preconceived, geographically circumscribed or socially constructed group.

With that being said, are some of the biological concepts of race used in genetics research examples of scientific racism?

Unlike earlier disagreements concerning race and biology, today’s discussions generally lack clear ideological and political antipodes of “racist” and “non-racist.” Most discussions today about race among scientists concern examination of differences between groups with the goal of understanding human evolutionary history, and the relationship between our genes and our health with the goal of determining the best course of medical treatments. However, this doesn’t mean that the race concept in biology can’t be used to support racism.

An example of this is the concern many had in the wake of Nicholas Wade’s book A Troublesome Inheritance, which made claims about the genetic basis of social differences between races. Wade’s book forced a large group of leading genetics to publicly refute the idea that genetics supported such ideas. Other examples include outrageous and incorrect claims about the relationship between race, genetics and intelligence.

What will it require to take race out of human genetics?

Well, we make two proposals in our paper. The first is that we call upon journals to encourage the use of alternative variables to study human genetic diversity and to rationalize their use. Journals should require scientists publishing in their pages to clearly define how they are using such variables in order to allow scientists to understand and interpret data across studies and would help avoid confusing, inconsistent and contradictory usage of such terms. This has been tried before, but only in piecemeal fashion, making sustained change unfeasible.

We also recognize that the use of terms changes nothing if the underlying racial thinking remains the same. But we believe that language matters and that the scientific language of race has a considerable influence on how the public understands human diversity.

Second, we are calling upon the U.S. National Academies of Sciences, Engineering, and Medicine to convene an interdisciplinary panel of experts to help the field improve the study of human genetic diversity.

As an honest broker in science policy, the Academies can play a constructive role in bringing together natural scientists, social scientists and scholars from the humanities to find ways to study human genetic diversity that do not recapitulate the confusion and potential harm that comes with using the race concept.