Informations

Comment ces triplets codent-ils pour ces protéines ?


Je suis un peu confus par le schéma ci-dessus.

Le premier codon de l'ADN non altéré est AAG. Pendant la transcription, n'est-ce pas converti en UUC (ARNm). Alors, UUC ne code-t-il pas pour phe et non Lys ?

De même, comment le TAG code-t-il pour un codon d'arrêt ? N'est-il pas transcrit en AUC, quels codes pour ile ?

De plus, est-ce le brin codant ou le brin modèle ? S'il y a une mutation dans le brin codant, y a-t-il un impact sur la protéine ?


Dans la première image, AAG est le vrai codon de la Lysine. Ainsi, lorsque le ribosome atteint « AAG » dans l'ARNm, il recrute un ARNt Lysine.

Ce qui peut prêter à confusion, c'est l'utilisation du terme « brin codant » lorsqu'on parle de l'ADN. Le brin codant est illustré dans la deuxième image que vous avez postée, et c'est le brin codant de l'ADN que la première image représente. Ce que « brin de codage » signifie ici, c'est le brin qui regards comme l'ARNm ressemblera. Représenter le brin codant l'ADN comme ceci - c'est-à-dire comme une série de codons - peut être légèrement trompeur car nous ne connaissons que les codons moyenne quoi que ce soit sous la forme d'ARNm. Néanmoins, c'est une façon courante de penser à l'ADN.

Retour à la première image. Parce qu'il montre le "brin codant" de l'ADN, le "brin modèle" pour 5'-AAG-3' doit alors être 5'-CTT-3'. Par conséquent, lorsque ce brin est transcrit par l'ARN polymérase, le 5'-CTT-3'(ADN) devient 5'-AAG-3'(ARNm).


Comment l'ADN code-t-il pour les protéines ?

C'est probablement l'un des processus les plus complexes et assez difficile à expliquer dans un court espace.

Un aperçu:
ADN =>ARN=>Protéine
Voici les étapes :
Réplication
Transcription
Traduction

L'ADN reste dans le noyau cellulaire mais la production de la protéine a lieu dans le cytoplasme. Cela nécessite l'aide de l'ARNm. L'ADN a le code d'une protéine que l'ARNm doit copier, puis retirer cette copie du noyau vers un autre organite appelé ribosome. Là, la copie est traduite en protéine.

Il existe trois types d'ARN : l'ARNm, l'ARNt et l'ARNr (ribosomique).

En traduction, l'ARN messager (ARNm) produit par transcription est décodé par un complexe de ribosome pour produire une chaîne d'acides aminés spécifique, ou polypeptide, qui se repliera plus tard en une protéine active à l'aide de l'ARNt.

Les ribonucléotides sont « lus » par la machinerie traductionnelle (le ribosome) dans une séquence de triplets nucléotidiques appelés codons. Chacun de ces triplets code pour un acide aminé spécifique. Ces acides aminés sont "ajoutés" un par un pour former une protéine.


Le dogme central : l'ADN code l'ARN L'ARN code la protéine

Figure 2. Les instructions sur l'ADN sont transcrites sur l'ARN messager. Les ribosomes sont capables de lire les informations génétiques inscrites sur un brin d'ARN messager et d'utiliser ces informations pour enchaîner les acides aminés en une protéine.

Le flux d'informations génétiques dans les cellules de l'ADN à l'ARNm à la protéine est décrit par le dogme central (figure 2), qui stipule que les gènes spécifient la séquence des ARNm, qui à leur tour spécifient la séquence des protéines. Le décodage d'une molécule à une autre est effectué par des protéines et des ARN spécifiques. Parce que les informations stockées dans l'ADN sont si essentielles à la fonction cellulaire, il est logique que la cellule fasse des copies d'ARNm de ces informations pour la synthèse des protéines, tout en gardant l'ADN lui-même intact et protégé. La copie d'ADN en ARN est relativement simple, un nucléotide étant ajouté au brin d'ARNm pour chaque nucléotide lu dans le brin d'ADN. La traduction en protéine est un peu plus complexe car trois nucléotides d'ARNm correspondent à un acide aminé dans la séquence polypeptidique. Cependant, la traduction en protéine est toujours systématique et colinéaire, de sorte que les nucléotides 1 à 3 correspondent à l'acide aminé 1, les nucléotides 4 à 6 correspondent à l'acide aminé 2, et ainsi de suite.


Code Triplet

L'ADN a quatre "lettres" qui doivent spécifier les 20 acides aminés différents qui composent les protéines. Combinatoirement, l'utilisation de trois lettres d'ADN pour un acide aminé est la plus logique.

Durée : 1 minutes, 7 secondes

Une fois la double hélice de l'ADN découverte, le prochain grand défi consistait à déterminer comment les quatre lettres de l'ADN pouvaient coder pour chacun des vingt acides aminés qui composent la protéine. La première question était combien de lettres d'ADN codées pour chaque acide aminé ? S'il s'agissait d'une lettre d'ADN pour un acide aminé, vous ne pouviez coder que pour un maximum de quatre acides aminés. Deux lettres dans chaque combinaison possible pourraient coder jusqu'à seize acides aminés. Ce n'est toujours pas suffisant. Mais trois lettres d'ADN fournissent plus qu'assez de combinaisons pour coder les vingt acides aminés. Donc trois était la réponse. C'était un code triplet.

double hélice d'adn,code triplet,lettres d'adn,code d'adn,acides aminés,pièces de code,pièces du puzzle,quatre lettres,code de localisation,acide aminé,code génétique,codon,deux lettres,narration,combinaisons,protéine,animation


Structure des acides aminés

Figure 2 Les structures des 20 acides aminés présents dans les protéines sont présentées. Chaque acide aminé est composé d'un groupe amino (NH+3), d'un groupe carboxyle (COO-) et d'une chaîne latérale (bleu). La chaîne latérale peut être non polaire, polaire ou chargée, ainsi que grande ou petite. C'est la variété des chaînes latérales d'acides aminés qui donne lieu à l'incroyable variation de la structure et de la fonction des protéines.

Comment 31 anticodons peuvent-ils correspondre à 61 codons ?

La promiscuité dans la reconnaissance des anticodons s'explique en partie par le résidu d'ARN spécifique de l'ARNt, l'inosine. L'inosine reconnaît les nucléotides U, C et A, et reconnaît plus spécifiquement la troisième base de codons, la « position d'oscillation ». L'ambiguïté de l'inosine est ce qui facilite le code génétique dégénéré.

Les codons mutés en position d'oscillation sont toujours reconnus par le même anticodon d'ARNt. Bien que ces « mutations synonymes » ne modifient pas la séquence d'acides aminés, elles sont toujours capables d'affecter les niveaux d'expression des protéines. C'est pourquoi l'optimisation de la conception de l'expression des protéines transgéniques est importante en biologie moléculaire.

1.Comprendre le biais de codon

Lors de l'expression de protéines, les mutations synonymes peuvent ne pas être neutres, car certains codons sont traduits plus efficacement que d'autres, créant biais de codons. Une mutation synonyme dans un codon avec une disponibilité limitée des anticodons d'ARNt correspondants pourrait entraîner une expression protéique significativement plus faible en raison du blocage du ribosome. De nombreux organismes affichent une utilisation biaisée des codons, et il est généralement admis que les biais des codons reflètent un équilibre entre les biais mutationnels et la sélection naturelle pour l'optimisation traductionnelle.

2. Soyez conscient de votre indice d'adaptation des codons

La mesure la plus courante de l'utilisation des codons est l'indice d'adaptation des codons (CAI). Cet indice examine l'utilisation des codons (résultant d'un biais de codons) dans les gènes hautement exprimés d'une espèce et évalue les codons qui sont préférentiellement utilisés dans cet ensemble de référence.

3.Utilisez les outils d'optimisation des codons

De nos jours, une variété de programmes, connus sous le nom d'outils d'optimisation de codons, existent pour vous aider à optimiser votre séquence dans votre espèce d'intérêt. Mais les outils d'optimisation des codons peuvent différer considérablement, les algorithmes de conception plus récents analysent bien plus que la simple utilisation des codons. Les propriétés supplémentaires à considérer sont :

  • Contenu du GC
  • Efficacité d'épissage
  • Promoteur & séquences TATA Box
  • Signaux de terminaison
  • Séquences CpG-méthylées
  • Séquences Shine-Dalgarno
  • Conformation de l'extrémité 5' de l'ARNm
  • Éléments d'ARNm 3' riches en AU
  • Repliement des protéines

Qu'est-ce que le code génétique

Le code génétique fait référence à l'ensemble des règles par lesquelles l'information génétique est codée dans le matériel génétique. Il définit comment le code à quatre lettres de l'ADN est traduit en code à vingt lettres des acides aminés. Les acides aminés sont les éléments constitutifs des protéines. Chaque acide aminé est représenté par un code de trois nucléotides appelé codon. Le code génétique qui représente les 20 acides aminés est montré dans Figure 1.

Figure 1 : Code génétique

64 codons sont inclus dans le code génétique, et 61 codons parmi eux représentent des acides aminés, les autres sont des codons stop. L'une des caractéristiques du code génétique est sa dégénérescence. Cela signifie qu'un seul acide aminé peut être représenté par plus d'un codon. Certaines autres caractéristiques du code génétique sont :

  • le code génétique ne se chevauche pas
  • un seul nucléotide ne peut pas faire partie de deux codons adjacents
  • le code génétique est presque universel.

Tous les acides aminés sauf deux (Met et Trp) peuvent être codés par 2 à 6 codons différents. Cependant, le génome de la plupart des organismes révèle que certains codons sont préférés à d'autres. Chez l'homme, par exemple, l'alanine est codée par GCC quatre fois plus souvent que par GCG. Cela reflète probablement une plus grande efficacité de traduction par l'appareil de traduction (par exemple, les ribosomes) pour certains codons par rapport à leurs synonymes. [Suite]

Gènes mitochondriaux

La raison : ces mitochondries utilisent UGA pour coder le tryptophane (Trp) plutôt que comme terminateur de chaîne. Lorsqu'elle est traduite par la machinerie cytosolique, la synthèse s'arrête là où Trp aurait dû être inséré.

  • les mitochondries animales utilisent l'AUA pour la méthionine et non l'isoleucine et
  • toutes les mitochondries de vertébrés utilisent AGA et AGG comme terminateurs de chaîne.
  • Les mitochondries de levure attribuent tous les codons commençant par CU à la thréonine au lieu de la leucine (qui est toujours codée par UUA et UUG ​​comme dans l'ARNm cytosolique).

Gènes nucléaires

On a trouvé quelques eucaryotes unicellulaires, notamment parmi les ciliés, qui utilisent un ou deux voire les trois de leurs codons STOP pour les acides aminés. Seuls les codons STOP apparaissant à proximité de la terminaison de chaîne de déclenchement de queue poly(A).


Comment sont fabriquées les protéines dans la cellule ?

La protéine est transcrite à partir de l'ARN messager (ARNm) par les ribosomes sur le réticulum endoplasmique rugueux ou les ribosomes dans le cytoplasme. Celui-ci détecte le codon de départ et se déplace le long de l'ARNm en « lisant » les bases de l'ARN en triplets (par exemple AUT, CGG, GAU). Cette combinaison de 3 bases est connue sous le nom de codon. L'ARN de transfert (ARNt), apporte l'anti-codon qui est un triplet d'acides aminés complémentaires à ceux de l'ARNm. Ces anti-codons codent pour 1 acide aminé. Au fur et à mesure que le ribosome se déplace le long de l'ARNm en lisant la séquence, l'ARNt se joint et contribue à son acide aminé. Les acides aminés sont reliés par des liaisons peptidiques. Finalement, le ribosome rencontrera le codon d'arrêt qui lui dit d'arrêter la transcription et aucun autre acide aminé n'est ajouté. Cela donne la séquence primaire de la protéine qui peut se replier dans sa structure secondaire (hélice alpha ou feuille plissée bêta), qui est déterminée par liaison hydrogène. La structure tertiaire est la forme tridimensionnelle de la protéine, c'est ce qui donne aux enzymes leur site actif de forme unique. Ceci est déterminé par les groupes R des acides aminés et peut être une combinaison de liaisons hydrogène, ionique et covalente, ainsi que la formation de ponts disulfure. La protéine peut voyager jusqu'au corps de Golgi pour être emballée ou modifiée


Le code génétique

Les protéines sont des polymères linéaires de blocs de construction individuels appelés acides aminés (page 37). La séquence de bases le long du brin d'ADN détermine la séquence des acides aminés dans les protéines. Il y a 20 acides aminés différents dans les protéines mais seulement 4 bases différentes dans l'ADN (A, T, C et G). Chaque acide aminé est spécifié par un codon, un groupe de trois bases. Comme il y a 4 bases dans l'ADN, un code à trois lettres donne 64 (4 x 4 x 4) codons possibles. Ces 64 codons forment le code génétique - l'ensemble d'instructions qui indique à une cellule l'ordre dans lequel les acides aminés doivent être joints pour former une protéine. Malgré le fait que la séquence des codons sur l'ADN détermine la séquence des acides aminés dans les protéines, l'hélice d'ADN ne joue pas elle-même de rôle dans la synthèse des protéines. La traduction de la séquence des codons en acides aminés se produit grâce à l'intervention de membres d'une troisième classe de molécules, les ARN messagers (ARNm) (Fig. 4.7). L'ARN messager agit comme une matrice, guidant l'assemblage des acides aminés dans une chaîne polypeptidique. L'ARN messager utilise le même code que celui utilisé dans l'ADN avec une différence : dans l'ARNm, la base uracile (U) (Fig. 2.13 à la page 34) est utilisée à la place de la thymine (T). Lorsque nous écrivons le code génétique, nous utilisons généralement le format ARN, c'est-à-dire que nous utilisons U au lieu de T.

Le code est lu par groupes séquentiels de trois, codon par codon. Les codons adjacents ne se chevauchent pas et chaque triplet de bases spécifie un acide aminé particulier. Cette découverte

Graphique 4.6. Une propagation des chromosomes humains (à la métaphase—voir page 403). Le signal vert révèle le gène appelé FMO3, qui, une fois muté, provoque la triméthylaminurie (syndrome de l'odeur de poisson) (Medical Pertinence 4.1). Il existe deux copies du gène, une héritée de chaque parent, indiquée par les flèches. Le gène FMO3 est situé sur le bras long du chromosome 1, le plus long chromosome humain.

Graphique 4.6. Une propagation des chromosomes humains (à la métaphase—voir page 403). Le signal vert révèle le gène appelé FMO3, qui, une fois muté, provoque la triméthylaminurie (syndrome de l'odeur de poisson) (Medical Pertinence 4.1). Il existe deux copies du gène, une héritée de chaque parent, indiquée par les flèches. Le gène FMO3 est situé sur le bras long du chromosome 1, le plus long chromosome humain.

ARNm de transcription H 5'-IaUGIGGCUIUACICCCIUGCICUGI -3'

Protéine de traduction H N-terminal met gly tyr pro cys leu C-terminal M G Y P C L

Le brin d'ADN 3' à 5' est transcrit en une molécule d'ARNm qui est traduite, selon le code génétique, en protéine. Notez que l'ARNm est fabriqué dans la direction 5' à 3' et que les protéines sont synthétisées à partir de l'extrémité N. Les codes d'acides aminés à 3 et 1 lettre sont affichés.

Graphique 4.7. Le dogme central de la biologie moléculaire.

a été réalisée par Sydney Brenner, Francis Crick et leurs collègues en étudiant l'effet de diverses mutations (changements dans la séquence d'ADN) sur le bactériophage T4, qui infecte la bactérie commune E. coli. Si une mutation provoquait l'ajout ou la suppression d'un ou de deux nucléotides à une extrémité de l'ADN T4, un polypeptide défectueux était produit, avec une séquence d'acides aminés complètement différente. Cependant, si trois bases étaient ajoutées ou supprimées, la protéine fabriquée conservait souvent sa fonction normale. Ces protéines se sont avérées identiques à la protéine d'origine, à l'exception de l'ajout ou de la perte d'un acide aminé.

L'identification des triplets codant pour chaque acide aminé a commencé en 1961. Cela a été rendu possible en utilisant un système de synthèse de protéines acellulaire préparé en brisant des cellules d'E. coli. Des polymères d'ARN synthétiques, de séquence connue, ont été ajoutés au système acellulaire avec les 20 acides aminés. Lorsque la matrice d'ARN ne contenait que des résidus uridine (poly-U), le polypeptide produit ne contenait que de la phénylalanine. Le codon spécifiant cet acide aminé doit donc être UUU. Une matrice poly-A a produit un polypeptide de lysine, et poly-C un de proline : AAA et CCC doivent donc spécifier respectivement la lysine et la proline. Des polymères d'ARN synthétiques contenant toutes les combinaisons possibles des bases A, C, G et U ont été ajoutés au système acellulaire pour déterminer les codons des autres acides aminés. Une matrice constituée de l'unité répétitive CU a donné un polypeptide avec la séquence alternée leucine-sérine. Comme le premier acide aminé de la chaîne s'est avéré être la leucine, son codon doit être CUC et celui de la sérine UCU. Bien qu'une grande partie du code génétique ait été lue de cette manière, les acides aminés définis par certains codons étaient particulièrement difficiles à déterminer. Ce n'est que lorsque des molécules d'ARN de transfert spécifiques (page 163) ont été utilisées qu'il a été possible de démontrer que GUU code pour la valine. Le code génétique a finalement été résolu grâce aux efforts combinés de plusieurs équipes de recherche. Les dirigeants de deux d'entre eux, Marshall Nirenberg et Gobind Khorana, ont reçu le prix Nobel en 1968 pour leur contribution au décryptage du code.


Voir la vidéo: Ravintolisät (Janvier 2022).