Informations

Un bon site Web/livre pour comprendre le repliement des protéines et les enzymes ?


Je cherche une bonne explication, compréhensible et simple sur le repliement, les mécanismes et la fonction des protéines, et leur relation avec les enzymes.

Je comprends que la protéine est une chaîne polypeptidique, je connais sa composition, mais la partie que je ne peux vraiment pas comprendre est "le repliement des protéines", je veux dire "Comment une chaîne polypeptidique droite se transforme en une structure pliée complexe ?"


D'accord, donc pour l'introduction les 4 niveaux de structure protéique (chaque niveau influence les niveaux après) :

  • primaire (1er) : l'ordre des acides aminés.
  • secondaire (2e) : hélices alpha et feuilles bêta
  • tertiaire (3e) : structure 3d complexe
  • quaternaire (4e) : 3e+ éléments non protéiques (ions, cofacteurs etc)
    et/ou plusieurs sous-unités interagissent. Toutes les protéines n'ont pas ce genre
    de structure.

Je pense que le premier n'a pas besoin d'explication.

La structure secondaire est l'endroit où les acides aminés forment des structures 2D : hélices alpha ou feuillets bêta. De wikipedia sur a-helix et b-sheet

L'hélice alpha (hélice ) est une structure secondaire commune des protéines et est une conformation enroulée à droite ou en spirale (hélice) dans laquelle chaque groupe NH du squelette donne une liaison hydrogène au groupe C = O du squelette de l'acide aminé quatre résidus plus tôt (i+4 ightarrow i liaison hydrogène)

Le feuillet (également le feuillet plissé ) est la deuxième forme de structure secondaire régulière des protéines. Elle est moins courante que l'hélice alpha. Les feuilles bêta sont constituées de brins bêta reliés latéralement par au moins deux ou trois liaisons hydrogène du squelette, formant une feuille plissée généralement torsadée.

Les images sont d'ici, c'est un excellent site qui explique la structure de base des protéines d'une manière tout à fait compréhensible.

Ces structures secondaires sont importantes car elles peuvent provenir de motifs ayant des fonctions spécifiques telles que la liaison à l'ADN, la surface d'interaction avec d'autres protéines. Les sites wiki mentionnés ci-dessus contiennent des informations détaillées. Ces structures et motifs secondaires servent de bloc de construction pour les fonctions d'ordre supérieur. Entre les motifs, des parties non structurées "lâches" peuvent être trouvées pour permettre la flexibilité.

Structure tertiaire : C'est le niveau où la structure géométrique 3D complexe est définie. Les structures 2D susmentionnées sont emballées dans des domaines - un seul élément fonctionnel d'une protéine. Une seule protéine peut avoir plusieurs domaines et la position relative de ces domaines entraîne la structure tertiaire. Les domaines eux-mêmes sont connectés à des régions lâches qui ne présentent aucune structure d'ordre élevé et offrent une flexibilité entre les domaines. La flexibilité est nécessaire pour les changements de conformation.

La structure quaternaire est l'endroit où des éléments non protéiques et/ou de multiples sous-unités sont impliqués. Par exemple le positionnement du groupe hème dans l'hémoglobine. Ou lorsque des monomères provenant de dimères, trimères, etc., donc en général, lorsque des protéines matures se réunissent pour former un complexe plus important.

Voici une belle image sur les différents niveaux de structure :

source : https://dopeahmeanbio.files.wordpress.com/2013/03/333.gif">les liaisons disulfure stabilisent la structure. Il s'agit également d'un événement naturel. Les ions de liaison, les cofacteurs, etc. stabilisent également la protéine structure.

Le processus de repliement peut également être pris en charge par des protéines chaperons. Ces protéines peuvent activement « tordre » la chaîne polypétide en utilisant l'ATP comme source d'énergie. Ils peuvent "détecter" s'il y a des chaînes d'acides aminés hydrophobes face à la surface externe de la protéine, une chose généralement évitée car ces acides aminés doivent faire face à la surface interne de la protéine où ils peuvent éviter l'eau - c'est énergétiquement mieux. Ce signal (AA hidofobies tournés vers l'extérieur) indique que soit la protéine est dépliée/mal repliée, soit elle est endommagée à cause, par exemple, de la chaleur - qui dénature ("déroule") les protéines.

Enfin la page wiki sur le repliement des protéines si vous en avez besoin de plus. J'espère que ça aide.


Toutes les informations se trouvent ici :

http://www.ncbi.nlm.nih.gov/books/NBK21054/

Tout le livre est là, il suffit de chercher la partie qui vous intéresse ou vous pouvez aussi trouver la version papier dans une bibliothèque. La partie sur la structure des protéines est le chapitre 3.

C'est un manuel utilisé dans certains cours d'introduction à la biochimie et à la biologie cellulaire à mon université, il couvrira donc les bases ainsi que des choses plus détaillées.


Pour les connaissances de base, je recommanderais la 5e édition de "la cellule" et la 6e édition des "Lehninger Principles of Biochemistry" (3e et 4e chapitre). Même la biochimie de Lippincott (chapitre 2) et la biochimie de Stryer (6e édition, chapitre 2) sont bonnes. Vous pouvez trouver la 5e édition de Stryer ici http://www.ncbi.nlm.nih.gov/books/NBK21154/ Si vous avez accès à une bibliothèque, vous pouvez essayer les dernières éditions. Sinon, des éditions plus anciennes sont disponibles en ligne. Le repliement des protéines devrait figurer parmi les premiers chapitres.


OMI, c'est de loin la meilleure introduction aux mécanismes enzymatiques et au repliement des protéines, par un chercheur de premier plan dans le domaine.

Structure et mécanisme en science des protéines : un guide sur la catalyse enzymatique et le repliement des protéines

par Alan Fersht


Pourquoi est-il si difficile d'obtenir la meilleure note en biologie de niveau A ?

Je me rends compte qu'il est très difficile d'obtenir la meilleure note dans n'importe quelle matière de niveau A, mais il y en a certaines où il me semble que les notes A*/A sont rares et la biologie semble être l'une de ces matières. Dd vient de récupérer ses résultats AS et vient juste d'obtenir un B. Elle est déçue parce qu'elle sentait qu'elle connaissait bien le sujet et qu'elle n'aurait pas pu faire plus d'efforts. Son professeur a dit qu'il est important d'utiliser les mots clés et la terminologie dans l'examen et elle pense qu'elle l'a fait. Y a-t-il autre chose qu'elle pourrait faire ou un moyen d'améliorer sa technique d'examen ? Je lui ai suggéré d'obtenir une copie de son script (si cela est possible) et de demander à son professeur de le parcourir avec elle pour découvrir où elle a perdu des points. Existe-t-il de bons sites Web ou des livres qui pourraient vous aider ? Elle m'a demandé si je pouvais lui trouver un professeur particulier, mais je pense que son professeur est très bon et je ne sais pas si cela aiderait beaucoup.

Tout conseil serait très apprécié!

Je pense que les conseils du professeur sont judicieux.
Mes deux DC ont bien réussi en biologie et les conseils du collège étaient cohérents. La biologie nécessite beaucoup de connaissances factuelles, mais la technique de réponse et la terminologie sont tout aussi importantes. Faites beaucoup, beaucoup d'articles passés, puis lisez et étudiez attentivement le rapport des examinateurs.

DS a fait de la biologie AS et on lui a dit que la terminologie et la technique étaient vitales.


Biotechnologie pour mannequin

Je suis comptable dans une entreprise de biotechnologie et oui, je connais la comptabilité, mais j'ai vraiment du mal à comprendre comment les choses fonctionnent. Par exemple, toutes les différentes étapes cliniques et ce que cela implique, les résultats des données et le fonctionnement de la FDA, etc.

Existe-t-il un bon livre, une lecture ou des podcasts qui peuvent guider un mouton comptable perdu ?

Je veux juste apprendre les bases fondamentales et la terminologie.

Les scientifiques adorent vous parler de la science

Pas donné, mais ce livre donne un bel aperçu de tous les domaines d'expertise en biotechnologie :

O'Neill A Biotech Manager's Handbook: A Practical Guide (Woodhead Publishing Series in Biomedicine).

Je travaille dans la biotechnologie (commerciale) et cela m'a aidé à avoir une meilleure vue d'ensemble

pourquoi ne demandez-vous pas à vos collègues ? ils seront plus qu'heureux de vous parler de leur travail.

Totalement mais en temps de covid. Je n'ai pas l'occasion de parler à aucun d'entre eux. Je suis en quelque sorte coincé dans ma propre bulle financière parce que je suis nouveau dans l'entreprise

Bay Bridge Bio a un bon blog avec de nombreux articles pertinents qui pourraient vous aider à vous mettre à jour.

Comme cela a déjà été dit, demandez à vos collègues ce qu'ils font, les scientifiques en particulier sont généralement plus qu'heureux d'expliquer les choses.

Coursera propose un cours appelé Spécialisation en gestion des produits de développement de médicaments, qui comprend un ensemble de cours 3 donnant un aperçu de la découverte, du développement et de la commercialisation de médicaments. Cela vaut vraiment la peine de l'examiner gratuitement, ne vous embêtez pas avec les éléments du certificat.

Molécule d'un milliard de dollars par Barry Werth

-Contexte sur l'industrie dans son ensemble, tisse le scientifique avec l'entreprise

-Contexte stratégique sur une entreprise qui a rompu avec la découverte de médicaments pharmaceutiques typiques et a ouvert la voie à une approche plus moderne.

Essayez de parler à certains IP. Ils aiment vraiment parler de ce qu'ils font. Si vous avez une équipe de développement commercial, ils adorent vendre des choses et vous parler de tout ce que votre entreprise a à offrir et ils sont généralement très amicaux et bavards puisque cela fait partie de leur travail.

J'ai également constaté que la lecture des SOP peut être très instructive, si vous y avez accès. Nous avons un tas de conceptions d'étude, de rapports de données, de critères d'acceptation, etc. SOP qui couvrent la terminologie de base et de nombreux principes fondamentaux.

Faites la suggestion aux RH d'organiser une session de formation ou un cours pour les employés non scientifiques pour en savoir plus sur ce que fait l'entreprise.

Mon entreprise propose des vidéos récapitulatives rapides de 2 minutes sur ce que nous faisons, ainsi que des podcasts/webinaires plus longs. Ils les ont sortis assez souvent pendant les périodes de COVID. Si vous êtes intéressé, envoyez-moi un message.


Une simple question sur les acides aminés

Je serais intéressé d'entendre un expert à ce sujet - je crois comprendre qu'une mutation qui échange (disons) un groupe hydrophobe contre un autre (comme la leucine contre la valine) ne modifie pas beaucoup la fonction de la protéine. Le remplacement d'une lysine par de la cystéine * nuit * considérablement à la fonction.

C'est-à-dire que je comprends que les substitutions d'acides aminés vont de bénignes à indésirables en fonction de l'hydrophobie - est-ce le seul critère ? La cystéine s'engage également dans des liaisons disulfure. comme je l'ai dit, je serais intéressé d'avoir l'avis d'un expert.

Comme pour tout en biologie, il n'y a pas de réponse simple. Cela dépend vraiment de l'endroit où se trouve l'acide aminé sur la protéine. Dans certains cas, vous pouvez remplacer deux acides aminés aux propriétés très différentes et la protéine fonctionnera toujours correctement. Ces acides aminés sont généralement très éloignés des régions de la protéine impliquées dans sa fonction (sites de liaison, sites actifs, etc.). Il ne serait pas si surprenant qu'un mutant de lysine en cystéine ne modifie pas considérablement la fonction d'une protéine. Cela vous indiquerait, cependant, que la lysine n'est pas un résidu clé pour stabiliser la structure de la protéine ou activer sa fonction. Dans d'autres cas, vous pourriez faire des substitutions très conservatrices et détruire complètement la fonction de la protéine (souvent ce sont des acides aminés dans les sites actifs des protéines). Par exemple, quelque chose d'aussi subtil qu'une mutation leucine en valine pourrait altérer subtilement la forme du site actif d'une enzyme et, par exemple, l'empêcher de se lier à un certain inhibiteur (de tels cas sont courants dans le développement d'une résistance aux médicaments).

Cependant, en règle générale, substituer un acide aminé par un autre ayant des propriétés similaires sera moins susceptible de poser des problèmes. L'hydrophobie est un critère à considérer mais ce n'est pas le seul. Par exemple, remplacer un petit acide aminé comme l'alanine par un gros acide aminé comme la phénylalanine pourrait certainement causer des problèmes (par exemple, si l'alanine se tasse étroitement contre une autre région de la protéine, la grande phénylalanine pourrait entraver stériquement l'emballage).

Je serais intéressé d'entendre un expert à ce sujet - je crois comprendre qu'une mutation qui échange (disons) un groupe hydrophobe contre un autre (comme la leucine contre la valine) ne modifie pas beaucoup la fonction de la protéine. Le remplacement d'une lysine par de la cystéine * nuit * considérablement à la fonction.

C'est-à-dire que je comprends que les substitutions d'acides aminés vont de bénignes à indésirables en fonction de l'hydrophobie - est-ce le seul critère ? La cystéine s'engage également dans des liaisons disulfure. comme je l'ai dit, je serais intéressé d'avoir l'avis d'un expert.

Comme Yggg l'a souligné, c'est compliqué. Les protéines solubles ont des résidus polaires à leur surface, donc passer à une protéine insoluble ou moins soluble peut causer des problèmes.

Même s'il y a peu de changement dans l'hydrophobie, les interactions stériques peuvent toujours poser problème. Par exemple, le collage utilise de la glycine tous les 4 résidus (Gly-x-y) en raison de sa petite taille, il permet un emballage serré de l'hélice de tropocollagène. Même si vous le remplacez par un autre acide aminé assez petit, avec des propriétés polaires similaires (comme l'alanine ou la valine), l'encombrement stérique empêche l'hélice de s'emballer correctement et vous vous retrouvez avec http://en.wikipedia.org/wiki/Ehlers% E2%80%93Danlos_syndrome" [Cassé].

C'est pourquoi en génétique ou en biochimie, nous considérons tous les changements d'acides aminés dus à une mutation comme des mutations faux-sens. Ce n'est qu'en considérant rétrospectivement les impacts qu'ils ont sur la fitness que nous pouvons considérer qu'il s'agit d'une mutation « silencieuse » (vers la sélection naturelle).

Merci les gars. Ma seule connaissance est en termes de mutagenèse dirigée, et il semble y avoir un ensemble convenu de substitutions qui sont utilisées pour établir, par exemple, l'activité du site de liaison ou plus généralement, la fonction des protéines, comme celle-ci :

Le seul travail quantitatif que j'ai vu sur le repliement des protéines a été très. qualitatif.

Le problème à l'heure actuelle, c'est que les protéines ont trop d'interactions entre les nombreux résidus et les environnements dans lesquels elles existent pour prédire avec précision (au moins pour l'instant) le repliement des protéines. Je suis sûr que cela pourrait être fait dans une certaine mesure (en fait c'est le cas, avec des choses comme les hélices alpha et les feuilles bêta) pour les protéines plus petites (comme celle qui n'est vraiment qu'une hélice alpha), mais les protéines plus grosses ont des propriétés tertiaires et même quaternaires structure.

Parce que les protéines commencent à se replier pendant qu'elles sont synthétisées. Pensez-y comme à un morceau de fil en pleine croissance. Lorsque le fil est court, des interactions auront lieu sur ce qui est disponible. Bien que vous souhaitiez peut-être qu'une certaine interaction ait lieu avec le produit fini qui est « bloqué » en raison du pliage précoce. Entrez un chaperon.

Les chaperons ont beaucoup de tâches, pas seulement le pliage, mais aussi le réarrangement des liaisons. Par exemple, vous voudrez peut-être qu'un disulfure de cystéine soit lié à une autre certaine cystéine, même s'il y en a d'autres qui pourraient potentiellement se former. Vous avez donc des isomérases disulfure de protéines pour réarranger ces liaisons.

D'autres chaperons aident simplement à certains types de pliage de modification post-traductionnelle. Comme le pliage oxydatif, etc.

Non, car l'idée est qu'une fois que vous obtenez la protéine dans la forme correcte, d'autres interactions (disons des interactions polaires à l'extérieur d'une protéine soluble) conservent sa forme. Cela est particulièrement vrai pour les protéines solubles qui ont tendance à avoir des intérieurs très hydrophobes, de sorte que les interactions hydrophobes aident grandement à maintenir la forme en augmentant l'entropie de l'environnement protéine-aqueux.

Il existe deux approches générales pour prédire la structure des protéines. La première approche s'inspire du principe central de la biologie : l'évolution. Pour ces approches, vous recherchez des protéines dont la séquence est similaire à votre protéine cible en supposant que les protéines avec des séquences similaires ont probablement évolué à partir d'un ancêtre commun et ont probablement une structure identique ou similaire. En comparant les résultats de recherche aux bases de données de structures protéiques connues, on peut modéliser la structure de la cible en la faisant passer à travers les structures des résultats étroitement correspondants créant ce qu'on appelle un modèle d'homologie.

L'autre approche générale est davantage basée sur la physique/chimie. Ici, vous commencez avec un "champ de force" qui définit les énergies des interactions entre les différents groupes chimiques d'une protéine. Vous utilisez ensuite des méthodes de Monte-Carlo pour rechercher la configuration d'énergie la plus basse de la chaîne d'acides aminés, que vous supposez être l'état replié de la protéine. C'est un défi, cependant, car le paysage énergétique sur lequel vous devez rechercher est très approximatif et contient de nombreux minima locaux qui peuvent compliquer les simulations de Monte-Carlo. Cette approche, cependant, a été utilisée avec succès pour prédire les structures de petites protéines à partir de principes premiers, un exploit impressionnant en soi.

Évidemment, ces deux approches peuvent être combinées pour avoir encore plus de succès : la modélisation d'homologie peut créer une bonne estimation initiale de la structure de la protéine qui peut ensuite être affinée via des méthodes de Monte-Carlo.

Un problème avec ces approches, cependant, est qu'elles ne vous donnent pas beaucoup d'informations sur le mécanisme réel du repliement des protéines (c'est particulièrement vrai pour l'approche inspirée de la biologie, certains ont utilisé des simulations de Monte-Carlo pour essayer d'avoir un aperçu de repliement des protéines). Pour simuler informatiquement le repliement des protéines, vous devez effectuer des calculs de dynamique moléculaire. Ici, vous prenez la protéine que vous souhaitez étudier et calculez les forces entre tous les atomes du système en utilisant votre champ de force, écrivez les équations de Newton pour chaque atome de votre système, laissez les atomes bouger légèrement, recalculez toutes les forces, et répéter. Les tailles de pas entre le recalcul des forces doivent être très petites (


Un long temps à venir

Il n'est pas rare de trouver des articles scientifiques commençant par une déclaration selon laquelle la découverte examinée résout une « question de longue date », car il y a beaucoup de telles questions en science. Il n'y a qu'un certain nombre de problèmes qui peuvent être étudiés, les ressources sont limitées, donc certaines questions doivent attendre en ligne. Parfois, il s'agit de se poser la question dans un domaine qui suscite peu d'intérêt, mais dans d'autres, il s'agit tout simplement de manque d'informations ou d'outils adaptés pour y faire face. Par exemple, il y a la question de ce qui fait une abeille particulière (Apis mellifera) devenir reine ? Eh bien, une réponse simple mais imprécise est que la gelée royale fait le travail, car elle est nourrie aux larves dont la reine est issue. Mais la gelée est un mélange complexe à base d'eau de lipides, de sucres, de minéraux et de protéines. Comme le note Gene Robinson (2011 : 454) : « Malgré un intérêt scientifique et économique intense, les substances spécifiques de la gelée royale qui provoquent cette transformation remarquable avaient, jusqu'à présent, échappé à la détection. »

Un indice qui a aidé à résoudre le problème a été la découverte qu'il y avait des différences liées à la température dans la puissance de la gelée, avec une perte d'effet progressive si elle est stockée à 40 ° C jusqu'à ce que toute activité soit perdue après 30 jours. Lorsque les divers constituants ont été séparés les uns des autres et stockés dans ces conditions, une protéine s'est détériorée exactement de la même manière que la puissance de la gelée. La protéine est appelée royalactine, et lorsqu'elle est donnée aux larves, elle provoque les effets classiques de la reine : temps de développement raccourci, masse accrue et peut-être plus important encore, des ovaires plus gros. Ce qui est étrange, c'est que quand Drosophile les larves sont nourries de royalactine, elles aussi se développent en reines, même s'il n'y a pas de reines dans cette espèce. Mais qu'est-ce qui a poussé les chercheurs à même donner la protéine aux mouches ? Tant de travail a été fait sur Drosophile génétique et développement que les chercheurs pensaient que ce système pourrait leur donner des indices sur la façon dont la royalactine produisait ses effets, et ils avaient raison. En utilisant une combinaison d'interférence ARN de l'expression génique et d'autres facteurs de contrôle génétique, ils ont découvert que la royalactine stimulait la signalisation via le récepteur du facteur de croissance épidermique (EGFR) dans les corps gras. Ensuite, l'EGFR active les enzymes qui contrôlent la taille et la durée de vie des cellules. Enfin, ils ont utilisé l'interférence ARN du gène EGFR chez les abeilles pour montrer que la royalactine agit également via l'EGFR chez cette espèce.

Dans son examen de cette recherche, Robinson décrit les rebondissements que les études sur le développement des reines des abeilles ont pris au fil des ans, y compris une étude de 1948 utilisant Drosophile. Il y avait plusieurs indices que la gelée royale était impliquée, mais ils n'ont jamais conduit à des résultats définitifs sur la détermination de la caste. Ensuite, la recherche s'est concentrée sur l'hormone juvénile, et même sur les voies de signalisation liées à l'insuline. C'est un excellent exemple des rebondissements que peuvent prendre les enquêtes, qui avancent petit à petit mais n'arrivent toujours pas au cœur du sujet. La recherche signifie vraiment tâtonner dans l'obscurité et peut parfois s'éloigner de la cible ainsi que vers elle, ce qui rend difficile de prédire où la percée se produira. Comme pour les travaux sur la thalidomide chez les poulets et les poissons zèbres, l'importance d'organismes modèles tels que Drosophile est à nouveau mis en évidence. Il y a une raison pour laquelle les chercheurs continuent de se concentrer sur les mêmes créatures : la connaissance peut vraiment engendrer plus de connaissances.


Blog universel

Critique:
C'est un livre superbe pour comprendre l'excitation en biochimie et pour comprendre sa pertinence pour la santé humaine. Le livre de Stryer présente la biochimie d'une manière complètement différente. Au lieu de présenter traditionnellement un sujet après l'autre, il présente chaque chapitre en donnant une molécule ou un système représentatif pour l'explication et la caractérisation du matériau de ce chapitre. Par exemple, l'hémoglobine et la myoglobine pour expliquer la structure tridimensionnelle des protéines, le lysozyme et la chymotrypsine pour expliquer l'action des enzymes, et une foule d'autres. Chaque exemple est choisi de manière critique, compte tenu de son rôle et de sa fonction dans la vie et le métabolisme. Cela rend la question très intéressante et pratique. Parallèlement, des descriptions de maladies et de troubles biochimiques ainsi que des perspectives historiques sont données. La dernière partie, la physiologie moléculaire, donne un exposé lucide des processus biochimiques fondamentaux dans les organismes vivants. En fait, tout le point de vue du livre est physiologique. Le livre est différent de Lehninger, qui est essentiellement un manuel traditionnel. Même si Lehninger est un excellent livre d'introduction, Stryer est, à mon avis, le livre à lire si vous voulez apprendre la biochimie en tant que discipline qui doit être considérée comme une excursion passionnante dans le métabolisme humain et la vie.

Bilan de la nouvelle édition (Berg, Tymockzo) :
J'avais écrit une critique favorable plus tôt pour une édition précédente de Stryer. Je repose mon cas pour la dernière édition aussi. Jeremy Berg et John Tymoczko, tous deux auteurs accomplis, se joignent à Lubert Stryer pour produire ce livre complet et éprouvé. Si vous êtes quelqu'un comme moi, qui croit que les enzymes et les protéines sont la clé pour comprendre les mystères de la vie, alors ce livre est pour vous. Bien qu'il ne couvre pas autant la biochimie de la chimie des acides nucléiques que certains des autres livres, je pense que la prochaine révolution en biologie dépendra de notre compréhension des SYSTÈMES. Et bien que la compréhension des gènes soit cruciale pour permettre la connaissance, si vous considérez vraiment toutes les actions réelles qui se produisent dans les systèmes biochimiques, presque toutes sont médiées par des enzymes et des récepteurs. La nouvelle édition de Stryer contient littéralement des centaines d'images et de discussions sur les protéines et les enzymes qui expliquent la structure et la fonction de ces magnifiques agents biologiques. Le livre a toujours conservé le style concis et pourtant complet qui a rendu son édition précédente si bonne. Encore une fois, le livre établit un bon équilibre entre manuel et biochimie médicale, ce qui est sa grande force. De petits encadrés et des discussions parallèles mettent en lumière les événements les plus intéressants liés au métabolisme des médicaments et à la maladie. En passant, les discussions sur la biologie des acides nucléiques que les auteurs ont incluses sont assez bonnes en elles-mêmes. La biochimie est l'une des branches les plus passionnantes de la recherche scientifique. C'est d'abord parce qu'il est hautement interdisciplinaire, bénéficiant d'une merveilleuse synergie avec la chimie organique et inorganique, la chimie physique et la physique, et bien sûr la biologie. Deuxièmement, la biochimie est un sujet extraordinairement dynamique et les connaissances biochimiques doublent tous les cinq ans. Les découvertes en biochimie affectent directement la science médicale. Au 21e siècle, il continue de nous promettre une compréhension radicale du fonctionnement de la vie, et tout bon livre de biochimie devrait idéalement transmettre cette excitation au lecteur. Celui-ci le fait. En fin de compte, si vous voulez vous enthousiasmer pour le miracle qu'on appelle la vie, et que vous voulez le faire de manière rationnelle, Stryer est toujours l'un des meilleurs. J'espère qu'il en sera encore ainsi.


Introduction

La structure 3D d'une protéine est déterminée en grande partie par sa séquence d'acides aminés 1 . Cependant, il est extrêmement difficile de prédire la structure des protéines à partir de la séquence seule 2 . Étant donné que la structure de la protéine est essentielle à l'analyse de sa fonction et de nombreuses applications telles que la conception de médicaments et/ou d'enzymes 3,4,5, la compréhension de la relation séquence-structure complexe est l'un des plus grands défis de la biologie computationnelle 6,7,8. La prédiction précise de la structure et de la fonction des protéines repose, en partie, sur la précision de la prédiction de la structure secondaire 9,10,11,12.

La structure secondaire des protéines (SS) fait référence à la conformation locale du squelette polypeptidique des protéines. Il existe deux états SS réguliers : l'hélice alpha (H) et le brin bêta (E), comme suggéré par Pauling 13 il y a plus de 60 ans et un type SS irrégulier : la région de la bobine (C). Sander 14 a développé un algorithme DSSP pour classer SS en 8 états à grain fin. En particulier, DSSP attribue 3 types d'hélice (G pour 310 hélice, H pour hélice alpha et I pour hélice pi), 2 types pour brin (E pour brin bêta et B pour pont bêta) et 3 types pour bobine (T pour tour bêta, S pour boucle à haute courbure et L pour irrégulier). Dans l'ensemble, la structure secondaire de la protéine peut être considérée comme un pont qui relie la séquence primaire et la structure tertiaire et est donc utilisée par de nombreux outils d'analyse structurelle et fonctionnelle 15,16,17,18.

La prédiction de la protéine SS a été largement étudiée 10,11,12,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35. De nombreuses méthodes de calcul ont été développées pour prédire à la fois la SS à 3 états et quelques-unes pour prédire la SS à 8 états. Pendant ce temps, la prédiction à 8 états peut fournir des informations de structure locale plus détaillées 33,34,36. Holley & Karplus 19 et Qian & Sejnowski 20 sont peut-être les premiers à avoir utilisé des réseaux de neurones (NN) pour prédire le SS, qui ont été suivis par quelques autres 19,21,23,24,37. L'amélioration la plus significative de la prédiction SS a été réalisée par Rost & Sander 23 et Zvelebil et al. 35 en utilisant un profil de séquence dérivé d'un alignement de séquences multiples 38,39,40. Jones et al. 24 a développé une méthode de réseau de neurones en 2 étapes PSIPRED, qui prend le profil de séquence PSI-BLAST 41 en entrée et obtient

Précision de 80% pour la prédiction SS à 3 états. D'autres méthodes d'apprentissage automatique incluent les réseaux de neurones récurrents bidirectionnels 26,34,37 (qui peuvent capturer la dépendance spatiale), les modèles graphiques probabilistes 25,29,42, les machines à vecteurs de support 27,28,30,43 et les modèles de Markov cachés 22,31.

Très récemment Baldi et al. 34 ont présenté une méthode basée sur des modèles pour la prédiction SS, qui peut donner une bien meilleure précision en utilisant des structures résolues comme modèles. Cependant, lorsque les modèles de fermeture ne sont pas disponibles, la méthode de Baldi fonctionne légèrement moins bien que PSIPRED. Cheng et al. 44 ont proposé une approche d'apprentissage en profondeur pour la prédiction SS à 3 états en utilisant un modèle de réseau de croyances profondes typique, dans lequel chaque couche est une machine de Boltzmann restreinte (RBM) 45 et entraînée par divergence contrastive 46 de manière non supervisée. Zhou & Troyanskaya 36 a rapporté une autre approche d'apprentissage en profondeur pour la prédiction SS à 8 états utilisant un réseau stochastique génératif supervisé, qui, à notre connaissance, peut être le meilleur prédicteur à 8 états. Cependant, ni Cheng ni Zhou n'ont signalé une précision supérieure à 80% pour la prédiction à 3 états.

La prédiction SS est généralement évaluée par la précision Q3 ou Q8, qui mesure le pourcentage de résidus pour lesquels la structure secondaire à 3 ou 8 états est correctement prédite 44 . Jusqu'à présent, la meilleure précision Q3 pour la prédiction ab initio (c'est-à-dire que les modèles ne sont pas autorisés) est

80% obtenu par PSIPRED et quelques autres approches de pointe telles que JPRED 47,48. Il est très difficile de développer une méthode capable de battre ce record de longue date. Cela peut être dû au fait que les architectures relativement peu profondes des méthodes existantes ne peuvent pas bien modéliser la relation séquence-structure complexe. Alternativement, la prédiction SS à 3 états pourrait également être mesurée par le score de segment de chevauchement (SOV), qui peut être interprété comme une précision basée sur le segment SS. Le SOV permet de petites prédictions erronées aux extrémités du segment SS, mais pénalise davantage les prédictions erronées dans la région médiane d'un segment SS 49 .

Dans cet article, nous présentons une méthode d'apprentissage automatique DeepCNF (Deep Convolutional Neural Fields) pour la prédiction SS à 3 et 8 états. DeepCNF combine les avantages des champs neuronaux conditionnels (CNF) 50 et des réseaux neuronaux convolutifs profonds (DCNN) 51 , qui capturent non seulement une relation séquence-structure complexe, mais modélise également la corrélation des étiquettes SS entre les résidus adjacents. DeepCNF est similaire aux champs aléatoires conditionnels (CRF) 52 et CNF 33 dans la modélisation de l'interdépendance entre les étiquettes SS adjacentes. Cependant, DeepCNF utilise DCNN pour remplacer les réseaux de neurones peu profonds utilisés dans CNF afin qu'il puisse capturer des relations très complexes entre les caractéristiques d'entrée et les étiquettes de sortie. Ce DCNN peut également inclure des informations de séquence à plus longue portée (voir les figures 1 et 2).

Un réseau de neurones profonds typique (UNE) vs un réseau de neurones profonds convolutifs (B). Un réseau de neurones profonds convolutif peut capturer des informations de séquence à plus longue portée qu'un réseau de neurones profonds typique lorsque les deux utilisent la même taille de fenêtre.


Microbiote intestinal chez les nourrissons allaités

Nina Kirmiz , David A. Mills , dans Probiotiques, prébiotiques et symbiotiques , 2016

10 Consommation de glycoconjugués de lait maternel par les bifidobactéries

Les glycoprotéines du lait maternel peuvent jouer un rôle dans la formation du microbiote intestinal ( Garrido et al., 2013a ). Différents chercheurs ont examiné la capacité des bactéries à dégrader et modifier les glycoconjugués ( Garrido et al., 2013a Hoskins et al., 1985 Variyam et Hoskins, 1981 ). Fait intéressant, il a été démontré que les glycoprotéines du lait enrichissent les bifidobactéries ( Hernandez-Hernandez et al., 2011 Kim et al., 2004 Petschow et al., 1999 Smilowitz et al., 2014 ). Par exemple, la lactoferrine a des effets stimulateurs de croissance sur Bifidobactérie spp. (Kim et al., 2004). De plus, des peptides spécifiques du lait dérivés de la lactoferrine stimulent prétendument la croissance des bifidobactéries (Liepke et al., 2002).

Certaines études se sont concentrées sur l'élucidation des mécanismes impliqués dans la dégradation des glycoprotéines par les bifidobactéries ( Garrido et al., 2012b, 2013a Kiyohara et al., 2012 ). Bifidobactéries associées aux nourrissons endo-β-N-libération d'acétylglucosaminidases N-glycanes de glycoprotéines ( Garrido et al., 2012b ). Plus précisément, endo-β-Nprésence d’acétylglucosaminidase dans des isolats de B. longum, B. infantis, et B. brève est en corrélation avec la capacité de ces souches à déglycosyler la glycoprotéine modèle ribonucléase B bovine (Rnase B) ( Garrido et al., 2012b ). De B. infantis ATCC 15695, l'endoglycosidase EndoBI-1 (glycosyl hydrolase famille 18) a une activité sur tous les principaux types de glycanes N-liés qui se trouvent dans les glycoprotéines (Garrido et al., 2012b). Cette enzyme a une activité sur les glycoprotéines du lait humain telles que la lactoferrine humaine, les IgA et les IgG et une activité sur les glycoprotéines avec différents types de glycosylation (Garrido et al., 2012b). De plus, certaines souches de bifidobactéries sont capables de dégrader la mucine (Crociani et al., 1994 Hoskins et al., 1985). De B. bifidum JCM1254, un roman α-N-acetylgalactosaminidase, NagBb (glycosyl hydrolase family 129), was identified and shown to cleave specific O-linked glycans that can be found in mucin ( Kiyohara et al., 2012 ).


Protein misfolding in hypertonic stress: new insights into an old idea. Focus on “Genome-wide RNAi screen and in vivo protein aggregation reporters identify degradation of damaged protein as an essential hypertonic stress response”

water is the most abundant molecule of the body, around 60% by weight. Volume and composition of cellular water, also known as internal milieu, are critical factors that affect cellular function because cellular water is the medium in which the majority of biochemical reactions take place. How cells adapt to hypertonic environment is an important subject that has been studied for a long time. The immediate consequence of exposure to a hypertonic environment is loss of cellular water due to osmosis. The loss of water results in two profound changes in the intracellular milieu: reduced volume and increased ionic strength. Macromolecular crowding (7) due to reduced cell volume and elevated ionic strength (9) have been considered to be the central elements of “hypertonic stress” because they are believed to perturb protein function based on observations made in test tubes and theoretical considerations. In a stunning revelation, a recent report (1) provides direct support for this old idea plus unexpected new insights.

Upon exposure to extreme hypertonic environment, animals or cells die in a dose-dependent manner. The threshold is a little over 400 mM NaCl for the nematode Caenorhabditis elegans (1) and � mosmol/kg for cultured mammalian cells (6). Both apoptosis and necrosis have been shown in the hypertonicity-induced cell death (2, 6). Choe and Strange (1) present an elegant and comprehensive body of work which demonstrates that indeed protein misfolding and protein aggregates are central features of hypertonic stress in C. elegans. The investigators performed genome-wide screen in C. elegans to find those genes of which their expression was required for survival under hypertonic conditions. The expression of 19,000 genes was individually knocked down using RNA interference followed by exposure to a hypertonic condition in which control animals display better than 90% survival. A total of 49 genes were found to significantly reduce survival when knocked down with the RNA interference. The investigators infer that these 49 genes are required for survival in hypertonicity. They are named Hos (hypertonic sensitive). Nearly half of the Hos genes (22 of 49) are predicted to function in removal of damaged proteins as they are either critical components of lysosomes and proteasomes, two organelles that degrade damaged proteins, or proteins that sort and deliver substrates to the organelles. Using model polyglutamine substrates in vivo, the investigators directly showed that hypertonicity induced protein aggregation in a manner dependent on reduced volume and elevated ionic strength. There was an excellent correlation between protein aggregation and reduced cell survival when expression of Hos genes were individually knocked down providing undisputable support that survival under hypertonicity required the ability of remove damaged proteins. In addition, hypertonicity caused a global increase in ubiquitination of cellular proteins. These results demonstrate that protein aggregates are produced under hypertonic conditions, and their removal by lysosomes and proteasomes is critical for survival.

Much effort has been directed to understanding how animals and cells adapt to hypertonicity. Most animals and cells are capable of adapting to extreme hypertonicity if hypertonicity is increased gradually over a sufficient period of time. The time is required for induction of adaptive mechanisms. The best characterized adaptive mechanism is the cellular accumulation of organic osmolytes. Both in C. elegans and mammals, hypertonicity induced gene expression is critical for the organic osmolyte accumulation. Dans C. elegans, the key event is induction of the GPDH gene that encodes glycerol 3-phosphate dehydrogenase, the rate-limiting enzyme in the biosynthesis of glycerol, which is the major organic osmolyte in the animal (4). In mammalian renal medulla, stimulation of the transcription factor TonEBP (tonicity-responsive enhancer binding protein) in response to local hypertonicity leads to induction of those genes encoding plasma membrane transporters for organic osmolytes (sodium-inositol cotransporter, sodium-chloride-betaine cotransporter, and sodium-chloride-taurine cotransporter) and rate-limiting biosynthetic enzymes (aldose reductase for sorbitol and neuropathy target esterase for glycerophosphocholine) (see Ref. 3 for a recent review). Because of inherent low membrane permeability, the organic osmolytes are trapped inside the cell promoting osmosis to regain volume and restoration of ionic strength. As such, cellular accumulation of organic osmolytes directly neutralizes the sources of stress. Indeed, when the nematodes were pretreated for a couple of days in mild hypertonicity of 200 mM, the animals became dramatically resistant to protein aggregation (1) and death (4) in response to subsequent extreme hypertonicity.

Whereas the report provides a satisfying cell biological and biophysical support for an old concept of protein damage by hypertonicity, it raises new questions as any good scientific discovery does. Previously studies by the same lab suggested that disturbances in protein homeostasis triggered by interference in protein synthesis, folding, or degradation signal to the induction of the GPDH gene (5). Does this mean that protein misfolding and/or protein aggregation is the signal for the induction of GPDH in response to hypertonicity? Another intriguing question was discussed in the paper: are the protein quality control pathways regulated by hypertonicity? If so, this should add to the adaptive process (see Fig. 1 ). The use of polyglutamine substrates is notable in that these are model substrates for the polyglutamine neurodegenerative diseases that develop in aging (8). Are the same cellular pathways involved in protein damage induced by both aging and hypertonicity? What are signals and pathways responsible for cell death in response to accumulation of damaged proteins? This question is actively pursed in the field of neurodegenerative diseases such as Huntington's disease and amyotrophic lateral sclerosis. Thus it is not far-fetched to expect that cellular response to hypertonicity share the same pathways with age-induced neurodegenerative diseases.

Nature of hypertonic stress and adaptive cellular response in Caenorhabditis elegans. Cell shrinkage due to osmosis causes protein misfolding and accumulation of protein aggregates leading to cell death. Glycerol 3-phosphate dehydrogenase (GPDH), a rate-limiting enzyme in glycerol biosynthesis, is induced by hypertonicity leading to cellular accumulation of glycerol and restoration of cell volume and ionic strength. Two prominent questions raised are shown: whether the protein misfolding and aggregation are the signal for the induction of GPDH, and whether protein quality control pathway is induced in response to hypertonicity.


Reviewer’s comments

Reviewer 1: Dr. Henri Grosjean (nominated by Dr. P. Lopez-Garcia)

In this manuscript, the authors hypothesize that the specific functions assigned to the 2′-3′ hydroxyls during peptide bond formation on the ribosome has co-evolved with the mechanism of tRNA aminoacylation and editing activities by the 2 classes of aminoacyl-tRNA synthetases (aaRSs), and with the isomerase activity of EF-Tu employing a mixture of the 2′(3′)-aminoacyl-tRNA isomers as substrates. Their main idea of the paper is that the true catalysts of peptide bond formation on the ribosome are the aminoacylated tRNA molecules, the aaRSs and the PTC of ribosome mainly allowing the proper positioning of the aa-tRNAs with the respective active sites. In other words, the tRNA molecule merely functions as a ribozyme, an idea that fits with the now generally admitted hypothesis that ancient protein synthesis machinery was governed by RNA. This paper is a logical prolongation of an earlier work (J. Theor Biol-2004) more focused on the coevolution hypothesis between amino acid biogenesis, aaRSs and the genetic code. These two papers complete each other very well. The present manuscript is clearly written, and while no experimental evidences are provided, the hypothesis is convincing.

Minor remarks: Page 8 GCA ancient codon? This should be developing a bit because the argument is not obvious. Page 9 > > 20° should be 20°C of course. Page 15, cys-editing should be written cis-editing (this mistake occurs 3 times in the text).

Authors’ response: We accepted all the remarks of Reviewer 1, and corrected the text accordingly. As to the antiquity of the GCA codons, we added a few sentences at the end of that discussion, to clarify our arguments.

Reviewer 2: Prof. Manuel Santos (nominated by Prof. Yitzhak Pilpel)

In this hypothesis paper Mark Safro and Liron Klipcan put forward the hypothesis that the functions of the 2′and 3′ hydroxyls of the conserved tRNA 3′-terminal adenosine (A76) observed during peptide bond formation at the peptidyl transferase centre (PTC) of the ribosome co-evolved with the two modes of attack on the aminoacyl-adenylate carbonyl typical of the two classes of aaRSs and also with the isomerase activity of EF-Tu. The authors recognize the fundamental roles of the 3′-OH and 2′-OH groups in protein synthesis and develop their arguments with several examples that highlight the relevance of the 2′-OH and 3′-OH chemistry at the amino acid activation, editing, transfer to the elongation factor and PTC levels. This is an expected outcome of the 2′-OH and 3′-OH multilayered chemistry, it would be surprising if it worked in a different manner. The value of this highly descriptive hypothesis paper that reviews old concepts is that it highlights the overlooked chemistry of the 2′-OH and 3′-OH, bringing it to current debate. This is important and sufficient to recommend its publication. However, there are several aspects of the paper that should be improved before publication, namely:

1. The first part of the manuscript (including the abstract) is poorly written and should be improved. There are many grammatical errors along the manuscript.

2. On page-4, third paragraph, the authors state that “the ribosome is a spectacular fossil artefact”. Looking at the ribosome as a fossil artifact is simply wrong. This should be changed to make to sentence clear.

3. The 3 subheadings dedicated to the aminoacylation reaction, the aaRS classes and the early role of Class-II aaRS in genetic code translation should be fused into a single subheading and the text shortened. It is too descriptive and repetitive.

4. Page-14, second paragraph. The sentence “….transtion from statistically encoded proteins to error-prone translation” should be clarified. It does not make sense.

5. Page -14, third paragraph, additional references should be included. This is a highly speculative paragraph that could be improved.

Quality of written English: Needs some language corrections before being published.

Authors’ response: As to the criticism of the sentences on pages 4 and 14 we formulated them in more clear form by modifying the text thus: a) the sentence on page 4 now reads, “The ribosome is an ancient molecular machine governed by RNA” b) the corrected sentence on page 14 now reads, “A cornerstone in the evolution of the genetic code entails the transition from early proteins that may have been inherently statistical that is, one of several stereochemically analogous amino acids might have been brought to a given position in the polypeptide chain, to protein with unique sequences and 3D-structures.” According to the referee’s request we added references within the third paragraph on page 14 and 15.

The authors agreed with the referee’s suggestion to improve the first part of the manuscript by combining three subheadings of the manuscript dedicated to the aminoacylation reaction, the aaRS classes, and the early role of Class-II aaRS in genetic code translation, into a single section. We fully rewrote this part of the manuscript. While we agree with the reviewer that the introduction should contain a more comprehensive description of the translational apparatus, we would note that the modern system of genetic code translation, even at its simplest, is an extremely complex process, and includes a fair number of macromolecular components. A detailed description of even its major elements would increase the length of the manuscript dramatically.

Reviewer 3: Dr. Koonin E.V.

This article discusses a problem that is both enormously important and staggeringly hard, namely the origin of the modern-type translation system. The authors suggest propose several interesting ideas and make remarkable inferences. To me, the most striking point is that tRNAs effectively act as ribozymes in the modern translation system, both in the aminoacylation and in the peptidyltransferase reactions. Even if not entirely new, this is a startling conclusion, and I find it regrettable that the authors explicitly mention it only in passing, in the Concluding Remarks. The main point of the article, however, is the hypothesis that modern-type translation started with aminoacylation of 3′-OH of A76 in tRNAs that is facilitated by Class II aaRS. Subsequently, under this scenario, Class I aaRS that initially aminoacylate at 2′-OH of A76, followed by isomerization facilitated by EF-Tu, were added to the system. The idea that 3′-OH aminoacylation is primordial certainly is plausible, given that this is the final form in which aminoacyl-tRNAs participate in peptide synthesis. Furthermore, the association of Class II aaRS with chemically simple and supposedly primordial amino acids is compatible with the primacy of this class. However, the evidence of this primacy from protein sequence and structure comparison is weak at the very best. There is just as good a reason to believe that Class II aaRS evolved from coenzyme biosynthesis enzymes (biotin synthetase, same superfamily in SCOP) as there is for class I aaRS, it is just less well publicized. Furthermore, the fact that the substrate-binding domain of class I aaRS belongs to one of the most common, simple protein folds (the Rossmann fold) whereas Class II enzymes adopt a more rare and complex fold, might be used as argument for the primacy of Class I. Moreover, the author repeatedly imply that the transition from statistical peptide synthesis to modern type translation was brought about by the recruitment and diversification of the aaRS. This is extremely unlikely to be the case because both classes of the aaRSs seem to be rather late arrivals in the evolution of the respective protein folds, their emergence being antedated by extensive protein evolution [1,2]. The same holds for EF-Tu which belongs to a small branch within the huge GTPase superfamily [3]. Thus, counterintuitive as that might seem, apparently, there was a high-fidelity RNA-based translation system, and one would think that the roots of the key features of modern translation should be sought there. In that regard, it is very strange that the authors do not examine the properties of the small aminoacylating ribozymes which are among the most remarkable molecules that are relevant for the origin of translation. The GUGGC-3′ ribozyme indeed aminoacylates at 3′-OH [4] which is fully compatible with the primacy of this reaction.

Thus, the hypothesis proposed by the authors in itself is indeed plausible and deserves publication and discussion. However, in the present manuscript, much of the argument is missing, flawed, muddled or tangentially relevant. In addition to the major issues outlined above, I find the discussion of cysteine incorporation in Archaea (which the authors consider to be ancestral without any good reason) as well as the mechanism of PheRS to be largely irrelevant and more confusing than enlightening.

1. Aravind L, Mazumder R, Vasudevan S, Koonin EV: Trends in protein evolution inferred from sequence and structure analysis. Curr Opin Struct Biol. 2002, 12:392-399.

2. Aravind L, Anantharaman V, Koonin EV: Monophyly of class I aminoacyl tRNA synthetase, USPA, ETFP, photolyase, and PP-ATPase nucleotide-binding domains: implications for protein evolution in the RNA. Protéines 2002, 48:1-14.

3. Leipe DD, Wolf YI, Koonin EV, Aravind L: Classification and evolution of P-loop GTPases and related ATPases. J Mol Biol 2002, 317(1):41-72.

4. Yarus M: The meaning of a minuscule ribozyme. Philos Trans R Soc Lond B Biol Sci. 2011, 366:2902-2909.

une. Reviewer’s comment: “..the association of Class II aaRS with chemically simple and supposedly primordial amino acids is compatible with the primacy of this class. However, the evidence of this primacy from protein sequence and structure comparison is weak at the very best. There is just as good a reason to believe that Class II aaRS evolved from coenzyme biosynthesis enzymes (biotin synthetase, same superfamily in SCOP) as there is for Class I aaRS, it is just less well publicized. Furthermore, the fact that the substrate-binding domain of Class I aaRS belongs to one of the most common, simple protein folds (the Rossmann fold) whereas Class II enzymes adopt a more rare and complex fold, might be used as argument for the primacy of Class I”.

Answer: Indeed, we agree that aaRSs associated with class I and II aaRSs evolved at a time when some proteins and canonical folds were already well-established. These ancient proteins might be associated with coenzyme biosynthesis enzymes such as biotin synthetase, or with biosynthesis of fatty acid derivatives, for example. We previously showed that all structural domains of biotin synthetase have structural homologs in multi-domain β-subunit of PheRS. Remarkable similarity when all structural domains of one multi-domain protein appear to be constituents of the other multidomain protein supports a concept of a common ancestor for two different enzymes [1,2].

In our discussion, we entertain the proposal that class II aaRSs were the first to replace ribozyme-based aminoacylation. Considerable evidence exists in favor of this point: 1) the amino acids formed in the Miller experiment are mostly class II-related 2) the reconstructed chronology of amino acids introduction into the genetic code, as presented by E. Trifonov [3], strongly suggests the association of early amino acids with class II 3) the so-called, more ancient “second genetic code”, located in the stem-loop of the tRNA, is primarily recognized by class II aaRSs 4) our findings [4] suggest that organization of amino acid biosynthetic pathways, and clustering of aaRSs into different classes are intimately related to one another. A plausible explanation for such a relationship is dictated by early link between aaRSs and amino acid biosynthetic proteins. The aaRSs’ catalytic cores are highly relevant to the ancient metabolic reactions, namely to amino acid and cofactors biosynthesis. In particular it has been shown that class II aaRSs mostly associated with the primordial amino acids, while class I aaRSs are usually related to amino acids that evolved at a later stage [4]. The statement regarding the simplicity and structural priority of the Rossmann fold, at least, is non-trivial. For example it was hypothesized that aaRSs of two classes were originally associated with one common tRNA molecule [5,6]. Additionally, Carter and Duax in 2002 reported that complementary fragments of the specific DNA region in Achlya klebsiana code for proteins (not aaRSs) that have the same folds as class I and II synthetases [7].

1) Artymiuk PJ, Rice DW, Poirette AR, Willet P: A tale of two synthetases. Structure de la nature. Biol. 1994, 1:758-760.

2) Safro MG, Mosyak, L: Structural similarities in the noncatalytic domains of phenylalanyl-tRNA and biotin synthetases. Science des protéines. 1995, 4:2429-2432.

3) Trifonov EN: Consensus temporal order of amino acids and evolution of the triplet code. Gène. 2000, 261:139-51.

4) Klipcan L, Safro M: Amino acid biogenesis, evolution of the genetic code and aminoacyl tRNA synthetases. J. Theor Biol. 2004, 238:389-396.

5) Rodin S, Rodin A, Ohno S: The presence of codon-anticodon pairs in the acceptor stem of tRNAs. Proc Natl Acad Sci U S A. 1996, 93:4537-42.

6) Ribas de Pouplana L, Schimmel P: Aminoacyl-tRNA synthetases: potential markers of genetic code development. Tendances Biochem Sci., 2001, 26: 591-6.

7) Carter CW, Duax WL: Did tRNA synthetase classes arise on opposite strands of the same gene? Mol Cell. 2002, 10:705–708.

b. Reviewer’s comment: “…I find the discussion of cysteine incorporation in Archaea (which the authors consider to be ancestral without any good reason) as well as the mechanism of PheRS to be largely irrelevant and more confusing than enlightening”.

Answer: Genome-wide analysis revealed that cysteine content was dramatically increased (a so- called “gainer” amino acid) only after the existence of LUCA, suggesting late incorporation of cysteine into the genetic code [8,9]. Indeed, in organisms using the standard CysRS-tRNA Cys pathway of aminoacylation, this probably is the case. However, our concept is that high cysteine content in methanogenic Archaea (considered being very ancient) and the way it forms Cys-tRNA Cys (via a tRNA-dependent pathway of cysteine biosynthesis, using L-phosphoserine as a precursor, and the class II aaRS SepRS [10]), suggests that cysteine was abundant in some ancient organisms. We used this example as an indication of the antiquity of tRNA-dependent pathways in such organisms. This point of view was supported very recently by results published by Zhang et. Al. [11]: “These results indicate that tRNA-dependent Cys biosynthesis appeared 500 million years earlier (

3.5 Ga) than the tRNA-independent counterparts (

3.0 Ga), supporting a previous opinion that tRNA-dependent Cys biosynthesis had a very ancient origin (Klipcan et al., 2008)”.

8) Jordan IK, Kondrashov FA, Adzhubei IA, Wolf YI, Koonin EV, Kondrashov AS, Sunyaev S. A universal trend of amino acid gain and loss in protein evolution. La nature. 2005, 433:633-8.

9) Brooks DJ, Fresco JR. Increased frequency of cysteine, tyrosine, and phenylalanine residues since the last universal ancestor. Mol Cell Protéomique. 2002, 1:125-31.

10) Sauerwald A, Zhu W, Major TA, Roy H, Palioura S, Jahn D., Whitman WB, Yates JR 3rd, Ibba M, and Soll D. RNA-dependent cysteine biosynthesis in archaea. Science. 2005. 307:1969-1972.

11) Zhang H-Y, Qin T, Jiang Y-Y, Caetano-Anollés G. Structural phylogenomics uncovers the early and concurrent origins of cysteine biosynthesis and iron-sulfur proteins. J. Biom. Str. Dynamics, 2012 30:542–545.

c) Reviewer’s comment: “…This is extremely unlikely to be the case because both classes of the aaRS seem to be rather late arrivals in the evolution of the respective protein folds, their emergence being antedated by extensive protein evolution [12,13]. The same holds for EF-Tu which belongs to a small branch within the huge GTPase superfamily [14].

Answer: We completely agree with the reviewer’s remark that the RNA based translation system was already well-established thus, could be active without EF-Tu [15,16] and based on aaRSs ribozymes.

12) Aravind L, Mazumder R, Vasudevan S, Koonin EV: Trends in protein evolution inferred from sequence and structure analysis. Curr Opin Struct Biol. 2002, 12:392-399.

13) Aravind L, Anantharaman V, Koonin EV: Monophyly of class I aminoacyl tRNA synthetase, USPA, ETFP, photolyase, and PP-ATPase nucleotide-binding domains: implications for protein evolution in the RNA. Protéines. 2002, 48:1-14.

14) Leipe DD, Wolf YI, Koonin EV, Aravind L: Classification and evolution of P-loop GTPases and related ATPases. J Mol Biol. 2002, 317:41-72.

15) Gavrilova LP and Spirin AS: Stimulation of "non-enzymic" translocation in ribosomes by p-chloromercuribenzoate. FEBS Lett. 1971, 17:324-326.

16) Gavrilova LP, Kostiashkina OE, Koteliansky VE, Rutkevich NM and Spirin AS: Factor-free (“Non-enzymic”) and factor-dependent systems of translation of polyuridylic acid by Escherichia coli ribosomes. J Mol Biol. 1976. 101:537-552.

This referee made remarks regarding the grammatical imprecision, misspellings, and quality of the written English. We accepted all his suggestions, and made corrections accordingly. The manuscript was extensively edited by a scientific editor.