Informations

Nomenclature des gènes non descriptive


Je viens officiellement d'une formation en physique/chimie physique, mais j'ai commencé à me spécialiser dans le domaine des sciences biomédicales et du génie biomédical. Je me suis retrouvé à lire un article qui parle de l'utilisation de leucocytes comme vecteurs pour l'administration ciblée de médicaments anticancéreux. L'une des molécules d'adhésion fréquentes qui apparaît dans le papier est E-sélection, dont j'ai consulté la page wikipedia pour en savoir plus sur la molécule.

Sur cette page wikipedia, il est dit que la sélectine E est codée par le gène SELE. Maintenant, je peux voir que le gène s'appelle "SELE" car il abrège "Selectine E", mais ma question est : comment est-ce devenu le nom "officiel" du gène ? Pourquoi le nom officiel ne révèle-t-il rien sur la séquence nucléotidique réelle du gène ? Si quelqu'un n'avait jamais entendu parler de l'E-sélectine auparavant, comment est-il censé apprendre quelque chose sur le gène juste du nom "SELE" ?

Désolé si c'est une question très pointilleuse. C'est juste que la plupart des substances dont on parle en chimie ont des noms officiels qui révèlent des informations sur la structure, même s'il existe un « surnom » plus couramment utilisé.


Bienvenue sur Biology.SE.

À ma connaissance, il n'y a pas de bonne règle sur la façon de nommer les gènes. La première personne à nommer un gène ou un allèle est libre de choisir un élément qu'elle trouve facile à retenir et finalement intuitif. Parfois, l'auteur choisit juste un nom amusant. Voici quelques exemples de Drosophila melanogaster base de données:

  • sac de billes: impliqué dans l'oogenèse, la spermatogenèse.
  • à bout de souffle: impliqué dans le développement de la trachée.
  • tête de bouton: régule la segmentation de la tête.
  • insatisfaction: impliqué dans de nombreux aspects du comportement sexuel.
  • clochard: un élément génétique mobile.
  • Inde: pour "Je ne suis pas encore mort"; cette mutation fait vivre la mouche deux fois plus longtemps.
  • ventbeutel: allemand pour « chou à la crème ».

Avez-vous suggéré de nommer les gènes en fonction de leur séquence ? Ce serait assez douloureux ! On ne peut pas nommer un gène en fonction de sa séquence car la séquence est beaucoup trop longue. La longueur médiane des gènes chez l'homme est de 24 000 paires de bases (Fuchs G et al. 2014). Il suffit de se référer à une base de données pour faire correspondre une séquence à un nom de gène (voir BLAST par exemple).

Comment pourrions-nous améliorer ce système?

Avez-vous une suggestion sur la façon dont nous devrions nommer les gènes? Devraient-ils être nommés en fonction du phénotype qu'ils affectent ou de la voie biologique dans laquelle ils sont impliqués ou peut-être autre chose ? Le problème est que nous annotons et nommons souvent un gène avant d'en savoir beaucoup sur son effet.

Notez que certains gènes ont plusieurs noms ce qui est effectivement déroutant. Ce serait bien de résoudre un peu ce problème.


Malheureusement, il n'y a pas de conventions de nommage rigoureuses pour un gène. Alors que certains sont basés sur une fonction moléculaire réelle ou un effet phénotypique, d'autres peuvent être des noms totalement bizarres. Certains sont en fait basés sur les étiquettes des éprouvettes et des fractions de purification. Certains sont nommés sur des personnages de la mythologie, des romans, etc.

Je vais ajouter quelques exemples :

PIÈGE (protéines impliquées dans la fusion des vésicules) : Soluble NSF UNEprotéine activée (où NSF est le facteur sensible au N-maléimide).

Nanog: Inspiré d'un conte folklorique irlandais. Il existe un pays magique appelé Tir-na-nÓg où si l'on va, devient immortel et toujours jeune. Ainsi, les découvreurs de ce gène responsable de la souche d'une cellule souche l'ont nommé Nanog.

En fait, beaucoup de Drosophile les gènes sont nommés d'après l'effet phénotypique visible de la mutation du gène. Par ex. Poilu, Sans ailes, Peignes sexuels réduits etc.

De nombreux gènes ont en fait été découverts avant que les génomes ne soient entièrement séquencés et comme ces gènes ont été bien étudiés, l'idée de les renommer n'aurait pas été très attrayante. Cependant, les gènes de levure ont reçu des noms systématiques formels.

De SGD

YAL001C premier ORF à gauche du centromère sur le chromosome I (A est la 1ère lettre de l'alphabet anglais), sur le complément ou brin de Crick

YGR116W 116ème ORF à droite du centromère sur le chromosome VII (G est la 7ème lettre de l'alphabet anglais), sur le brin Watson

Bien que je convienne que l'absence de toute convention de nommage ne transmettrait aucune information sur la fonction du gène, ces noms sauvages rendent l'étude de la biologie intéressante. Les noms des gènes systématiques de la levure sont si inintéressants et difficiles à retenir (du moins pour moi).

Cependant, il existe des référentiels de nucléotides standard tels que NCBI, ENA et DDBJ qui conservent des enregistrements sur différents gènes. De plus, il existe des bases de données standard spécifiques aux organismes telles que FlyBase pour Drosophile, TARE pour Arabidopsis etc. Dans ces bases de données, vous trouverez les noms standard et la description de ces gènes.


Jetez également un œil à cet article : Existe-t-il des manières plus descriptives de nommer les gènes et les interactions entre les gènes ?


Nomenclature et définitions du gène (avec diagramme)

Le mot gène a été introduit par Johannson en 1909 pour une seule unité héréditaire occupant une position spécifique (locus) dans un chromosome.

Il a été découvert plus tard que les gènes se trouvaient dans un ordre linéaire dans le chromosome et étaient transportés avec eux dans les cellules filles lors de la division cellulaire.

Le comportement des chromosomes et des gènes s'est avéré être parallèle. Ceci et d'autres informations génétiques ont conduit à la définition classique suivante d'un gène. Un gène est une unité héréditaire qui est transmise d'un parent par un gamète dans un chromosome et contrôle l'expression d'un caractère spécifique chez le jeune en coopération avec son allèle, d'autres gènes et son environnement.

Définition moderne du gène :

La définition ci-dessus d'un gène est devenue inadéquate au vu des nouvelles idées sur le gène et son rôle révélées par des recherches intensives au cours du dernier demi-siècle. Les définitions suivantes ont émergé des résultats de cette recherche.

1. Gène une séquence unique de paires de désoxyribonucléotides :

Il a été constaté que l'ADN est le matériel héréditaire. Il est composé d'une série linéaire de paires de désoxyribonucléotides qui forment un chromosome. Par conséquent, un gène est considéré comme un segment d'ADN ayant un nombre limité de paires de nucléotides dans une séquence unique. Différents gènes ont différentes séquences de paires de nucléotides. La séquence spécifique de bases dans un gène forme le code qui dirige la cellule pour synthétiser une protéine particulière.

2. Génère un code pour une seule protéine (enzyme) :

En 1948, Beadle et Tatum ont proposé leur célèbre hypothèse un gène-une enzyme (protéine), et ont considéré le gène comme une unité de matériel héréditaire qui code pour la formation d'une seule protéine (enzyme).

3. Génère un code pour un polypeptide :

Plus tard, il a été découvert que toutes les protéines n'agissent pas comme des enzymes, certaines protéines ont un rôle structurel dans les cellules et certaines fonctionnent comme des récepteurs membranaires. De plus, certaines protéines sont composées de plusieurs chaînes polypeptidiques. À la suite de ces découvertes, l'hypothèse de Beadle et Tatum a été remplacée par le principe d'une chaîne polypeptidique gène-un. Il visualise le gène comme une unité de matériel héréditaire qui code pour la synthèse d'un seul polypeptide.

4. Générer une unité de fonction (Cistron) :

Dans les années 1960, on a découvert que des gènes codaient pour l'ARNr et l'ARNt en plus des polypeptides. Cette découverte a rendu le concept ci-dessus trop étroit pour définir les gènes de manière adéquate. Des gènes ou régions régulateurs, tels que les opérateurs ou l'ADN procaryote, ont également été découverts. Ces gènes ne sont jamais transcrits. En plus de ceux-ci, certains virus ont des gènes chevauchants qui codent pour plus d'un polypeptide.

De plus, certains virus et organismes supérieurs possèdent des gènes qui codent pour de longues polyprotéines. Ces derniers sont ensuite clivés par des enzymes protéolytiques en de nombreuses protéines distinctes. Cela signifie qu'une partie du gène peut coder pour une protéine. En dehors de cela, un gène eucaryote peut avoir des introns non codants entre les exons codants. Ces recherches ont conduit au concept qu'un gène est un segment de molécule d'ADN qui code pour une unité de fonction. La fonction peut être de coder pour un polypeptide, une polyprotéine, un ARN ribosomique ou de transfert, ou de réguler l'activité d'autres unités fonctionnelles au sein de l'ADN.

5. Gène un segment d'acide nucléique :

Certains virus à ARN peuvent former directement de l'ARN génomique et de l'ARNm sans nécessiter d'intermédiaire d'ADN. Pour couvrir ces virus, un gène peut être défini comme un segment de molécule d'acide nucléique responsable de la synthèse d'un produit spécifique. Ainsi, notre concept de gène a considérablement changé, passant du "facteur de Mendel" à la "séquence unique de paires de bases de nucléotides" des généticiens modernes.

6. Définition synthétique du gène :

Selon le concept moderne, un gène

(i) Est un segment d'acide nucléique, généralement de l'ADN, rarement de l'ARN

(ii) Possède une séquence unique de bases nucléotidiques paris

(iii) Codes pour un polypeptide spécifique, ou un ARNr, ou un ARNt, ou une polyprotéine ou a un rôle régulateur

(iv) Peut subir un croisement et une mutation à certains moments et

(v) Peut contenir des informations continues ou fractionnées.

Même cette définition élaborée manque de précision. Il ne couvre pas les cas dans lesquels un gène influence plusieurs traits, ou plusieurs gènes (polygènes) déterminent un trait. Les gènes qui se chevauchent de certains virus ne sont pas non plus couverts par celui-ci.

Benzer en 1955 a introduit le concept d'un cistron comme unité de fonction. Un cistron est un segment d'ADN porteur d'informations pour la production d'une chaîne polypeptidique. Alors que le concept d'un gène change avec de nouvelles découvertes, sa définition en tant qu'unité d'hérédité est toujours valide.

Une partie d'une fonction de gène peut (sous-unités fonctionnelles de gène):

Il a été considéré plus tôt que le gène est l'unité de base de la fonction et que des parties du gène, si elles existent, ne peuvent pas fonctionner. Mais ce concept est désormais dépassé. Sur la base d'études sur le locus rll du phage T4, Benzer (1955) a conclu qu'il existe trois sous-divisions d'un gène, à savoir, recon, muton et cistron.

Ceux-ci sont brièvement décrits ci-dessous :

1. Cistron (Unité de fonction) :

L'activité d'un gène ne pouvant être détectée qu'en observant son effet, un gène peut ainsi être défini comme une unité de fonction, chaque unité déterminant un produit particulier. Il peut contenir jusqu'à 30 000 paires de nucléotides. C'est ce qu'on appelle le cistron (Fig. 8.1-A).

2. Recon (unité de recombinaison) :

Auparavant, on pensait que le croisement se produisait entre deux gènes. Benzer a démontré que le croisement ou la recombinaison se produit au sein d'un gène fonctionnel ou d'un cistron. Dans un cistron, les unités de recombinaison peuvent être plus d'une. Ainsi, la plus petite unité d'un gène (cistron) capable de subir une recombinaison est connue sous le nom de recon (Fig. 8.1-B).


Nomenclature des gènes identifiés par mutation

Ces règles doivent être suivies lors de la désignation d'un nouveau mutant isolé dans votre laboratoire.

Directives spécifiques: Les normes de nomenclature suivantes ont été adoptées par le Arabidopsis communauté et devraient être suivis dans les publications et les présentations.

  1. Les symboles de gènes mutants doivent avoir trois lettres (soulignées ou italiques) écrites en lettres minuscules (abc).
  2. Certains symboles de gènes choisis avant l'établissement de ces lignes directrices peuvent comporter deux lettres.
  3. L'allèle de type sauvage doit être écrit (souligné ou italique) en majuscules (abc).
  4. Les noms descriptifs complets du type sauvage (ALPHABÉTIQUE) et mutant (alphabétique) les allèles doivent être écrits de la même manière.
  5. Les produits protéiques des gènes doivent être écrits en majuscules sans italique (ABC).
  6. Les phénotypes peuvent être désignés par le symbole du gène (pas d'italique) avec la première lettre en majuscule. Ainsi Abc+ décrit le type sauvage Abc- se réfère au mutant. Le (+/-) doit être un exposant si possible.
  7. Différents gènes portant le même symbole se distinguent par des nombres différents (abc1 et abc2).
  8. Différents allèles d'un même gène sont distingués par un numéro suivant un tiret (abc4-1 et abc4-2). Lorsqu'un seul allèle est connu, le trait d'union n'est pas nécessaire. Ainsi abc3 = abc3-1 si un seul allèle est connu.
  9. Les mêmes règles de nomenclature s'appliquent aux mutations dominantes et récessives. La lettre "" peut être ajouté à la fin d'un numéro d'allèle dans le but de décrire les croisements si cet allèle présente une dominance simple par rapport au type sauvage. Ainsi abc5-2D indique que l'allèle #2 est dominant par rapport au type sauvage.

Détails supplémentaires: Des variations beaucoup plus importantes ont été observées dans la nomenclature des révertants, des suppresseurs, des doubles mutants, des allèles de mutants connus isolés dans différents laboratoires, des insertions d'ADN-T et de transposons, des fusions rapporteurs et des variants naturels identifiés dans différents écotypes.

  1. La désignation des numéros d'allèle a généralement été résolue par les groupes impliqués dans la coordination avec les centres de stockage.
  2. Les suppresseurs reçoivent généralement un symbole de gène différent, bien que dans certains cas, le symbole d'origine puisse être inversé (par ex. ted suppresseurs de dét mutants).
  3. Les révertants intragéniques peuvent être désignés en ajoutant la lettre "R" au numéro d'allèle. Ainsi unbc1-3R désigne le révertant héréditaire de la abc1-3 allèle mutant.
  4. De nombreuses revues ont leurs propres directives pour désigner plusieurs mutants. La façon la plus directe d'écrire le double mutant produit par croisement abc1 avec def2 est "abc1def2 double mutant".
  5. Les informations sur les marqueurs moléculaires associés aux mutants d'insertion doivent être exclues du symbole du gène.
  6. Lorsqu'il s'agit de gènes identifiés à partir de variants naturels dans différents écotypes, l'écotype Columbia doit être considéré comme de type sauvage, sauf lorsqu'il contient l'allèle récessif. Ce choix de Columbia comme écotype standard est cohérent avec le projet génome.
  7. Dans certains cas, il peut être approprié d'utiliser des lettres pour désigner l'écotype dans le symbole du gène. Par exemple, FLC-col a été utilisé pour désigner le FLC allèle de l'écotype Columbia.

Sélection d'un symbole de gène mutant: Les procédures suivantes doivent être suivies lors de la sélection d'un symbole de gène pour les variants monogéniques naturels et tous les mutants identifiés après irradiation, mutagenèse chimique et mutagenèse par insertion.

  1. La première étape consiste à déterminer si des mutants similaires ont déjà été décrits. Si tel est le cas, il peut être approprié de conserver un nom descriptif standard pour le phénotype (par ex. eceriferum) et modifiez simplement le numéro de locus. Les noms alternatifs sont moins acceptables lorsque le phénotype est défini de manière étroite, comme avec le brevipedicellus, cotylédon feuillu, teste transparente, et glabre Des classes. Les synonymes pour de tels mutants sont inutiles et souvent déroutants pour la communauté. Cependant, d'autres noms doivent être considérés comme acceptables et dans certains cas préférables lorsque le phénotype est défini de manière plus large, comme pour les nains, les mâles stériles, les embryons défectueux et les phénotypes de pousses et de racines désorganisées, ou lorsque le défaut cellulaire spécifique responsable du phénotype mutant est déterminé. Dans ces limites, les chercheurs devraient être libres de choisir des noms descriptifs qui reflètent leur point de vue sur les phénotypes mutants et les fonctions génétiques proposées.
  2. Lorsqu'un nouveau symbole de gène est justifié, la liste mise à jour des symboles de gène existants doit être consultée avant la publication pour s'assurer que le symbole souhaité est disponible. De nouveaux symboles doivent alors être réservés auprès du conservateur des symboles de gènes mutants. Le conservateur actuel est : David Meinke (Department of Botany, Oklahoma State University, Stillwater, OK 74078 USA Téléphone 1-405-744-6549 Fax 1-405-744-7074 e-mail [email protected]).

Exigences pour l'analyse des mutants: Les exigences de base pour l'analyse génétique devraient être les suivantes :

  1. Établir l'hérédité monogénique par analyse de ségrégation.
  2. Déterminer la dominance par rapport au type sauvage.
  3. Effectuez des tests d'allélisme avec des mutants apparentés.
  4. Cartographier l'emplacement du gène.
  5. Compléter une caractérisation détaillée du phénotype.

Liste de contrôle pour la publication: Normes communautaires pour les publications de recherche traitant de Arabidopsis des mutants sont nécessaires pour identifier les conflits potentiels dans la nomenclature des gènes. Les auteurs sont priés de respecter les normes de publication suivantes :

  1. Choisissez des symboles de gènes mutants qui n'entrent pas en conflit avec les symboles existants.
  2. Utilisez le symbole de gène accepté pour un locus connu sous plusieurs noms.
  3. Référez-vous aux synonymes d'un mutant donné dans le texte.
  4. Caractériser les modèles d'hérédité et fournir des descriptions détaillées des phénotypes mutants.
  5. Déterminer le nombre de gènes représentés dans une collection de mutants.
  6. Attribuez chaque mutant à un groupe de liaison et de préférence à une région chromosomique.
  7. Effectuez des tests d'allélisme avec des mutants apparentés qui correspondent à la même région chromosomique.
  8. Mettre les graines des mutants publiés à la disposition d'autres chercheurs pour les tests d'allélisme.
  9. Soumettre des informations aux bases de données pertinentes.

Pour toute correction ou ajout, merci de contacter David Meinke.

Veuillez suivre ce lien pour la publication complète sur les normes communautaires pour Arabidopsis La génétique


Nomenclature génétique bactérienne

Il existe des règles et des conventions généralement acceptées utilisées pour nommer les gènes chez les bactéries. Des normes ont été proposées en 1966 par Demerec et al. Ζ]

Règles générales

Chaque gène bactérien est désigné par un mnémonique de trois lettres minuscules qui indiquent la voie ou le processus dans lequel le produit du gène est impliqué, suivi d'une lettre majuscule signifiant le gène réel. Dans certains cas, la lettre du gène peut être suivie d'un numéro d'allèle. Toutes les lettres et tous les chiffres sont soulignés ou en italique. Par exemple, leuA est l'un des gènes de la voie de biosynthèse de la leucine, et leuA273 est un allèle particulier de ce gène.

Lorsque la protéine réelle codée par le gène est connue, elle peut alors faire partie de la base du mnémonique, ainsi :

  • rpoA encode la sous-unité de RN / A polymérase
  • rpoB encode la sous-unité de RN / A polymérase
  • polA encode l'ADN polymérase je
  • polC encode l'ADN polymérase III
  • rpsL encode ribosomal pla protéine, scentre commercial S12

Certaines désignations de gènes font référence à une fonction générale connue :

Mnémoniques courants

Gènes biosynthétiques

La perte d'activité génique entraîne un besoin nutritionnel (auxotrophie) non présenté par le type sauvage (prototrophie).

Certaines voies produisent des métabolites précurseurs de plusieurs voies. Par conséquent, la perte d'une de ces enzymes entraînera le besoin de plus d'un acide aminé. Par exemple:

  • gua = guanine
  • pur = purines
  • pyr = pyrimidine
  • tes = thymine

Gènes cataboliques

La perte d'activité génique entraîne une perte de la capacité de cataboliser (utiliser) le composé.

  • ara = arabinose
  • fille = galactose
  • lac = lactose
  • mal = maltose
  • homme = mannose
  • moi = mélibose
  • rha = rhamnose
  • xyl = xylose

Gènes de résistance aux médicaments et aux bactériophages

  • ampli = résistance à l'ampicilline
  • azi = résistance à l'azoture
  • bla = résistance aux bêta-lactamines
  • chat = résistance au chloramphénicol
  • kan = résistance à la kanamycine
  • rif = résistance à la rifampicine
  • tonA = résistance du phage T1

Mutations suppressives non-sens

Nomenclature des mutants

Si le gène en question est le type sauvage, un signe exposant « + » est utilisé :

Si un gène est mutant, il est indiqué par un exposant « - » :

Par convention, si ni l'un ni l'autre n'est utilisé, il est considéré comme mutant.

Il existe des exposants et des indices supplémentaires qui fournissent plus d'informations sur la mutation :

  • ts = sensible à la température (leuA ts )
  • cs = sensible au froid (leuA cs )
  • un m = mutation ambre (leuAun m)
  • euh = mutation ombre (opale) (leuAeuh)
  • oc = mutation ocre (leuAoc)
  • R = résistant (Rif R )
  • Δ = suppression (ΔleuA)
  • - = fusion (leuA-lacZ)
  • : = fusion (leuA:lacZ)
  • :: = insertion (leuA::Tn10)
  • Ω = une construction génétique introduite par un croisement en deux points (ΩleuA) [citation requise]
  • ??gène supprimé::gène de remplacement = suppression avec remplacement (ΔleuA::nptII(Kan R ) indique que le leuA le gène a été supprimé et remplacé par le gène de la néomycine phosphotransférase, qui confère une résistance à la kanamycine, comme cela est souvent noté entre parenthèses pour les marqueurs de résistance aux médicaments)

Nomenclature phénotypique

Lorsqu'il se réfère au génotype (le gène), le mnémonique est en italique et sans majuscule. Lorsqu'il se réfère au produit du gène ou au phénotype, le mnémonique est en majuscule et non en italique (par exemple. ADNA – la protéine produite par le adnA gène LeuA − – le phénotype d'un leuA mutant Amp R - le phénotype de résistance à l'ampicilline du gène de la -lactamase bla).

Nomenclature des noms de protéines bactériennes

Les noms de protéines sont les mêmes que les noms de gènes, mais les noms de protéines ne sont pas en italique et la première lettre est en majuscule. Par exemple. le nom de RN / A polymerase est RpoB, et cette protéine est codée par rpoB gène. Η]


Nomenclature non descriptive des gènes - Biologie

En accédant aux données de pseudomolécules du site Web du Rice Genome Annotation Project, les termes utilisés en interne par le Rice Genome Annotation Project tels que TU et modèle de gène peuvent être trouvés. Le but de cette page est d'expliquer la nomenclature utilisée par le projet et de la relier à la nomenclature couramment utilisée par les biologistes.

Unité de transcription (UT) :

Une unité de transcription est équivalente à un gène ou un locus sur la pseudomolécule. Les unités de transcription sont stockées dans la base de données en utilisant un schéma de nommage précis (feat_name) : x.tyyyyy , où le x fait référence au BAC ou pseudomolecule assembly id et yyyyy est l'identifiant distinct de l'unité de transcription.

Pour l'utilisateur final, une complication introduite par le schéma de nommage ci-dessus est que les feat_names des unités de transcription peuvent changer entre les versions. Pour contourner cela, des identifiants de locus pour les gènes ont été mis en œuvre dans cette libération des pseudomolécules. Une convention similaire à celle utilisée pour le génome d'Arabidopsis a été employée, avec une modification mineure pour la plus grande taille du génome du riz. Chaque gène nucléaire est étiqueté LOC_OsXXg##### avec LOC_Os faisant référence au locus Oryza sativa, XX faisant référence au chromosome 01-12, g faisant référence au gène et un nombre à 5 chiffres faisant référence à l'ordre des gènes sur le chromosome. Une convention de LOC_Osp#g##### est utilisée pour les gènes plastidiques, tandis que LOC_Osm#g##### pour les gènes mitochondriaux. Les gènes (loci) sont numérotés séquentiellement le long du chromosome ou du génome organellaire par incréments de 10, ce qui permettra l'insertion de futurs loci. Un espacement suffisant dans le système de numérotation pour les lacunes physiques a été prévu dans la séquence pour permettre l'insertion de nouveaux gènes dans le cas où la lacune physique est comblée. Pour faciliter l'intégration des nouveaux identifiants de locus avec les gènes dans nos deux versions précédentes, nous avons développé un convertisseur de version pour permettre aux utilisateurs de trouver facilement de nouveaux identifiants de locus pour les gènes et modèles précédents qui avaient été identifiés uniquement avec feat_names.


Exposants

Parfois, une lettre est utilisée comme nom d'un gène, et les exposants peuvent le modifier pour indiquer les différents allèles. Un code à une seule lettre commun pour une série allélique est &ldquoje". Les globules rouges peuvent voir leurs membranes cellulaires modifiées par des étiquettes de sucre qui donnent naissance à notre groupe sanguin. Un allèle de je donne naissance au groupe sanguin A et est donc appelé je un . Une enzyme codée par Je B modifie les sucres pour créer le groupe sanguin B. Un hétérozygote I A I B démontre les deux tags sucre parce que ces allèles sont exprimés et ils sont codominants. Les personnes de groupe sanguin O ne possèdent que des allèles pour le je gène qui ne fonctionne pas et qui est donc récessif et qui ne modifie pas les marqueurs de sucre extracellulaire. Parce qu'il est récessif, les individus sont homozygotes pour je: elles sont ii. Le chapitre 13, section 7 donne plus de détails sur cette série allélique.

Parfois, un exposant &ldquoplus sign&rdquo est utilisé pour désigner l'allèle de type sauvage. On pourrait utiliser le symbole W + pour indiquer un allèle de type sauvage et timide qui favorise la croissance des ailes. Notez que le nom générique du gène &ldquowing&rdquo n'est pas une bonne pratique &ndash nommez le gène d'après le phénotype mutant ! Un mutant sans ailes serait W ‐. Vous ne devez jamais utiliser un &ldquo+&rdquo et décaler la casse de la lettre à moins que vous n'ayez affaire à un cas particulier tel que la codominance dans l'exemple de groupe sanguin ci-dessus. La capitale & ldquojeLa lettre &rdquo indique qu'elle est dominante sur &ldquoje". Les exposants A et B pour les allèles codominants indiquent que les allèles dominants sont différents les uns des autres.

Figure A1.3 : Relation entre génotype et phénotype pour trois allèles du gène ABO humain. Les allèles I A et I B montrent une co-dominance. L'allèle I A est complètement dominant par rapport à l'allèle i. L'allèle I B est complètement dominant par rapport à l'allèle i. (Original-Deholos -CC:AN &ndash du chapitre 1)

Les exposants peuvent être des symboles, une seule lettre ou plusieurs lettres. Ils ne modifient le nom du gène que dans les symboles en exposant : les lettres de taille normale et timide sont identiques entre elles (voir tableau 1). Cela signifie que Abc + et abc seraient des gènes différents (c'est à dire. pas allélique) Abc + et Abc sont des allèles, tout comme abc + et abc. Notez qu'un exposant n'est pas obligatoire pour tous les allèles de ce gène, selon la convention.

Les allèles des gènes bactériens sont généralement indiqués par un exposant + ou -­. Par exemple, un allèle bactérien qui crée une enzyme qui fabrique la méthionine serait rencontré + , et un allèle défectueux de ce gène est rencontré -&timide .

Tableau 1 : Exemples de gènes utilisant un modificateur en exposant.
apr blanc ou abricot blanc Un allèle du blanche gène qui a un phénotype &ldquoapricot&rdquo
Abc + Abc Deux allèles pour le Abc (respectivement de type sauvage et mutant). Notez que l'allèle mutant est dominant.
w + w un w Trois allèles d'une série pour le gène w. Le premier est de type sauvage, les deux seconds sont des allèles mutants différents.
bio + bio - Un allèle de type sauvage d'un gène de biotine et son homologue récessif. Il s'agit probablement d'un gène bactérien dû à la convention.


Un cas pour simplifier la nomenclature des gènes à travers différents organismes

Les diamants mandarins fabriquent une hormone appelée mésotocine, qui diffère peu de l'ocytocine humaine.

Constantina Theofanopoulou voulait étudier l'ocytocine. Son travail de fin d'études s'était concentré sur la façon dont l'hormone influence le développement de la parole humaine, et maintenant elle se préparait à utiliser ces résultats pour étudier comment les oiseaux chanteurs apprennent à chanter dans le laboratoire d'Erich Jarvis à Rockefeller. Le problème était que les oiseaux n'ont pas d'ocytocine. C'est du moins ce qu'on lui a dit.

"Partout où j'ai regardé dans le génome", dit-elle, "je n'ai pas pu trouver un gène appelé ocytocine chez les oiseaux."

Theofanopoulou est finalement tombé sur la mésotocine, l'analogue de l'ocytocine chez les oiseaux, les reptiles et les amphibiens. Mais alors qu'elle fouillait dans la littérature, les eaux devenaient plus boueuses. Si elle et Jarvis voulaient trouver des études sur l'ocytocine chez les poissons, ils devaient se rappeler de rechercher le terme unique isotocine. À moins, bien sûr, qu'ils ne recherchent des études sur l'ocytocine chez certaines espèces de requins, auquel cas ils ont été obligés de rechercher dans les résumés de la valitocine, l'ocytocine de l'aiguillat commun. Des problèmes similaires se sont posés lorsqu'ils ont essayé d'étudier l'hormone vasotocine chez les oiseaux, appelée vasopressine chez l'homme. Et le récepteur de l'ocytocine, généralement abrégé OXTR dans les études sur les mammifères, pourrait être nommé VT3, MTR, MesoR ou ITR dans les études sur d'autres espèces.

« J'ai commencé à me perdre », explique Jarvis, directeur du Laboratoire de neurogénétique du langage. « J'ai dit qu'avant de creuser plus profondément, nous devons nous assurer que nous avons fait les bonnes hypothèses sur les gènes humains et oiseaux liés à l'évolution. »

Maintenant, dans une nouvelle étude dans Nature, Theofanopoulou et Jarvis démontrent que l'hormone humaine connue sous le nom d'ocytocine est en fait un seul et même gène dans toutes les principales lignées de vertébrés. Les similitudes sont en effet si frappantes que les scientifiques préconisent de nettoyer le jargon une fois pour toutes en appliquant une nouvelle nomenclature standard pour les hormones connues sous le nom d'ocytocine et de vasopressine chez l'homme, ainsi que leurs récepteurs respectifs.

Cette convention de nommage mise à jour faciliterait, à tout le moins, la vie des scientifiques qui étudient l'ocytocine. Mais il pourrait également servir de modèle pour traduire une vaste gamme de découvertes biologiques à travers les espèces, conduisant finalement à une meilleure compréhension du fonctionnement des mêmes gènes dans différents organismes.

Une approche du génome entier

Avant que le séquençage du génome entier ne donne aux scientifiques une vue d'ensemble du nombre de séquences génétiques similaires, les biochimistes attribuaient souvent des noms uniques à des gènes presque identiques en reconnaissance de légères différences, souvent sans conséquence. Cela a donné lieu à des conventions de dénomination étranges entre les espèces qui ont tellement déconcerté Theofanopoulou et Jarvis. "L'ocytocine chez les mammifères a un acide aminé différent de celui de la mésotocine chez les tortues", explique Theofanopoulou. "Avant d'avoir une perspective du génome entier, nous aurions pu penser qu'il s'agissait d'un gène entièrement différent."

Mais la similarité de séquence n'est pas le seul signe que deux gènes d'espèces différentes sont liés. Un autre est le territoire génique environnant de chaque gène sur son chromosome respectif, que les scientifiques appellent la synténie. En d'autres termes, l'identité d'un gène n'est pas constituée uniquement par la séquence « à l'intérieur » du gène, mais aussi par les gènes qui l'entourent, ces gènes trouvés « à l'extérieur » de ce gène. Et bien que l'ocytocine des mammifères diffère légèrement, dans l'ordre, de son analogue de tortue, cette nouvelle étude démontre qu'il existe une synténie dans l'ocytocine, la vasotocine et chaque récepteur d'hormone, à travers les génomes de 35 espèces qui couvrent toutes les principales lignées de vertébrés et quatre invertébrés. lignées.

« Avec la synténie, nous pouvons montrer que l'ocytocine chez les mammifères est le même gène que la mésotocine chez les tortues, car elle est située dans la même position synténique dans tous ces génomes, à savoir entourée des mêmes gènes d'une espèce à l'autre. La séquence des gènes au sein d'un gène a tendance à changer rapidement, mais l'ordre des gènes, la façon dont les gènes sont situés les uns après les autres, a tendance à être beaucoup plus conservé au cours de l'évolution. » dit Theofanopoulou.

Cette perspective plus large n'aurait pas été possible sans les récentes mises à jour qui ont rendu les génomes entiers plus complets et plus précis, un projet mené par le projet international Vertebrate Genomes, que préside Jarvis. Ceux-ci utilisent des lectures de séquences longues et des données à longue distance pour générer des assemblages de génomes presque complets au niveau chromosomique. Des génomes plus propres avec moins d'erreurs permettent aux scientifiques de rechercher des subtilités synténiques de nouvelles manières. « Beaucoup des génomes que nous avons examinés ne contiennent pas de chromosomes mélangés ou d'erreurs », déclare Jarvis. “Personne n'avait ça avant.”

Qu'est-ce qu'un nom ?

De nombreux autres gènes peuvent nécessiter ce type de réévaluation, pour faciliter la recherche translationnelle et faire entrer le vocabulaire scientifique dans l'ère post-génomique. Par exemple, des problèmes de nomenclature similaires existent au sein de deux gènes pertinents pour les travaux de Jarvis sur l'apprentissage vocal, SRGAP et FOXP2, et Theofanopoulou soupçonne que les conventions de dénomination pour les récepteurs de la dopamine et des œstrogènes peuvent également nécessiter des révisions. « Cet article sert de modèle pour réorganiser la nomenclature du génome en biologie, sur la base de l'évolution des gènes », explique Jarvis.

Mais si ces nouveaux noms resteront une question ouverte. Jarvis et Theofanopoulou subissent déjà un recul de la part de chercheurs qui hésitent à voir le long héritage de la recherche sur la mésotocine rebaptisé et associé à l'ocytocine ou à la vasopressine avec la vasotocine. "Nous avons parlé avec plusieurs personnes qui savaient que ces gènes étaient des analogues mais ont insisté sur le fait qu'ils ne peuvent pas être appelés par le même nom", a déclaré Jarvis. "Certains ont fait valoir que" c'est comme ça depuis des décennies. ""

D'autres craignent que, quelle que soit la syntaxe de ces gènes entre les espèces, il serait inexact et peut-être même trompeur d'utiliser le même nom pour le gène qui favorise la lactation chez les mammifères et joue clairement un rôle différent chez les oiseaux et les tortues. Jarvis n'est pas d'accord. « Un nom ne devrait pas être basé uniquement sur la fonction, mais aussi sur des similitudes génétiques et évolutives », dit-il.

« Nous pouvons maintenant montrer qu'il s'agit des mêmes gènes, car ils sont situés dans les mêmes blocs d'ordre génétique conservés dans le génome d'une espèce à l'autre », ajoute Theofanopoulou. "Si les gènes de ces hormones avaient été découverts à l'ère de la génomique d'aujourd'hui, ils auraient été nommés avec les mêmes noms et non des noms différents."


Nomenclature des gènes

L'une des grandes difficultés soulevées par les projets de séquençage du génome est de savoir comment nommer les gènes et les protéines qu'ils codent. This has not been easy and a number of committees have been set up to deal with this problem. In general, each gene is designated by an abbreviation, written in capitalized italics. For example, the human gene for flavin-containing monooxygenase is designated FMO. Because there is more than one FMO gene, we assign a number to identify the specific gene to which we are referring. The gene which when mutated gives rise to trimethylaminuria (page 82) is called FMO3. The protein encoded by the FMO3 gene is written in normal capitals, as FMO3. Similarly, cytochrome P-450 genes (page 249) are abbreviated to CYP. CYP3A4 is a gene that belongs to the CYP3 family. This family has several members so we must include additional information in the gene name to specify precisely the member of the CYP3 gene family we are referring to. The protein name is written as CYP3A4.


Non-descriptive gene nomenclature - Biology

NC-IUPHAR (the International Union of Basic and Clinical Pharmacology Committee on Receptor Nomenclature and Drug Classification) issues guidelines for the nomenclature and classification of (human) biological targets, including the targets of current and future prescription medicines. NC-IUPHAR also works to facilitate the interface between the discovery of new sequences from the Human Genome Project and the designation of the derived entities as functional biological targets and potential drug targets.

NC-IUPHAR has established close links with the HUGO Gene Nomenclature Committee (HGNC), which attributes human gene names the International Union of Pure and Applied Chemistry (IUPAC), to standardise correct use of drug names and the International Union of Biochemistry and Molecular Biology (IUBMB) to collaborate on receptor-related enzyme nomenclature.

NC-IUPHAR publishes official nomenclature reports, reviews and other articles on various topics [list of publications] and maintains an online database (IUPHAR-DB, now available through the Guide to PHARMACOLOGY: http://www.guidetopharmacology.org) giving peer-reviewed pharmacological, chemical, genetic, functional and anatomical information on pharmacologically-important receptors, ion channels, enzymes, transporters and other proteins encoded by the human, rat and mouse genomes.

A letter of guidance to journal editors can be downloaded here: IUPHARlettertoeditors.pdf

The following are links to relevant NC-IUPHAR pages and publications describing receptor nomenclature.

G Protein-Coupled Receptors

IUPHAR GPCR nomenclature available from the GPCR list.

Voltage-gated Ion Channels

IUPHAR VGIC nomenclature available from the VGIC list.

Click here to access articles in the IUPHAR VGIC compendium.

Ligand-gated Ion Channels

The nomenclature of ligand-gated ion channels and their subunits has recently been re-examined by NC-IUPHAR. Their revised recommendations for nomenclature are summarised here.

IUPHAR LGIC nomenclature published in

  • Collingridge GL, Olsen RW, Peters J, Spedding M. (2009)
    A nomenclature for ligand-gated ion channels. Neuropharmacologie.56 (1): 2-5 [Full Text]

Nuclear Hormone Receptors

IUPHAR NHR nomenclature published in

  • Germain P, Staels B, Dacquet C, Spedding M, Laudet V. (2006)
    Overview of Nomenclature of Nuclear Receptors. Pharmacol Rev.58 (4): 685-704 [PDF][Full Text]

Click here to access articles in the IUPHAR NHR compendium.

Guidelines for nomenclature of new receptor subtypes

  • Vanhoutte PM, Humphrey, PPA, Spedding, M. (1996)
    International Union of Pharmacology. XI. Recommendations for nomenclature of new receptor subtypes. Pharmacol Rev.48 (1): 1-2 [PDF]

Recommendations on terms and symbols in quantitative pharmacology

  • Neubig RR, Spedding M, Kenakin T, Christopoulos A. (2003)
    International Union of Pharmacology Committee on Receptor Nomenclature and Drug Classification. XXXVIII. Update on terms and symbols in quantitative pharmacology. Pharmacol Rev.55 (4): 597-606 [PDF][Full Text]

Further information and advice concerning the nomenclature of existing and newly discovered receptors and ion channels may be obtained by emailing us.

/>
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License


Biology nomenclature

As far as I know there is not official rules for distinguishing between genes and proteins of other species. The nomentlature only applies to the differenciate genes and proteins. for protein, it is not italized and the first letter is capital. For genes, italized but no capital letter.

Exemple: fourrure (gene) Fur (gene product)

Always remember that some people do not follow convention because these people are too old and do not want to change and some biologist have a weird sense of humor when it comes to naming proteins or genes.

for funny gene names see this site:

The convention for distinguishing genes from proteins seems to vary from journal to journal, so stick with whatever seems to be used in the journal you're most likely to publish in. Usually, genes are lowercase with or without italics, and proteins either start with a capital letter or are in all caps, but this isn't really done consistently all the time.

To distinguish proteins of different species, a lowercase letter in front of the protein abbreviation corresponding to the species is used. So, for something like prolactin, which is abbreviated PRL, for mouse you'd use mPRL (m is for murine, not mouse, incidentally), hPRL for human, ePRL for equine (horse), oPRL for ovine (sheep) rPRL for rat, and I'm not sure how you'd distinguish rat from rabbit, or anything else you start getting repeats of these letters for. I don't think it's a standard convention, but in our lab, we use two letters for some species to clarify this, since we work with proteins of many species. So, rt is for rat and rb for rabbit. It's not perfect. When in doubt, write the whole word out. For our lab, we just all use the same convention within the lab to avoid confusion, but write out the full word for publication and define any abbreviation as we would any other abbreviation.

I like the system used by the folks working with fruit flies! Basically, just pick a fun name that doesn't mean anything, just a good abbreviation that's fun to say. Considering how often a newly discovered gene or protein turns out to have a completely different function from what is initially thought, it saves a lot of trouble with names that don't fit the function. And it's better than naming things after the discoverer too. besides, that only works for the first thing you discover, then you still have to come up with new names after that.