Informations

Base de données pour la relation médicament-cible


Je rédige une thèse sur la bioinformatique et je recherche des bases de données sur les médicaments cibles. J'implémente une application open source pour un outil appelé Cytoscape et jusqu'à présent, j'ai utilisé une base de données open source appelée DrugBank pour récupérer des données sur les médicaments cibles, mais j'ai lu un article sur une base de données appelée Drug2Gene qui combine plusieurs ouvrir les bases de données dans un format unifié. Le papier date de 2014, mais tous les sites Web sont en panne et je me demandais si quelqu'un ici connaît d'autres bases de données/ressources qui font cela et sont peut-être à jour ? Je souhaite utiliser autant de données open source sur la relation médicament-cible que possible pour fournir un moyen simple d'accéder à toutes ces ressources. Drugbank est régulièrement mis à jour et constitue une bonne source, mais avec autant de bases de données différentes avec un chevauchement de données décroissant, j'étais heureux de tomber sur la base de données Drug2Gene pour me rendre compte que je ne pouvais pas l'obtenir et qu'elle n'était probablement pas à jour.

Je serai très reconnaissant pour tous les conseils car je suis purement informaticien et je me sens impuissant à trouver des choses liées à la biologie.

Source : article Drug2Gene


Il existe de nombreuses bases de données sur les médicaments. je pense DGIBd est un bon point de départ (voir ci-dessous). De plus, il existe de nombreuses bases de données qui décrivent les médicaments et leurs cibles, jetez-y un coup d'œil (et les liens en bas), j'espère que vous pourrez en utiliser plusieurs dans votre implémentation.

SIDER

SIDER contient des informations sur les médicaments commercialisés et leurs effets indésirables enregistrés. Les informations sont extraites de documents publics et de notices. Les informations disponibles incluent la fréquence des effets secondaires, les classifications des médicaments et des effets secondaires ainsi que des liens vers d'autres informations, par exemple les relations médicament-cible.


DrugCentral

DrugCentral fournit des informations sur les entités chimiques des ingrédients actifs, les produits pharmaceutiques, le mode d'action des médicaments, les indications, l'action pharmacologique. Nous surveillons régulièrement la FDA, l'EMA et la PMDA pour l'approbation de nouveaux médicaments afin de garantir l'actualité de la ressource. Des informations limitées sur les médicaments abandonnés et approuvés en dehors des États-Unis sont également disponibles, mais les informations d'approbation réglementaire ne peuvent pas être vérifiées.


Base de données de cibles thérapeutiques

Therapeutic Target Database (TTD) est une base de données qui fournit des informations sur les protéines thérapeutiques et les cibles d'acides nucléiques connues et explorées, la maladie ciblée, les informations sur les voies et les médicaments correspondants dirigés contre chacune de ces cibles. Cette base de données comprend également des liens vers des bases de données pertinentes contenant des informations sur la fonction cible, la séquence, la structure 3D, les propriétés de liaison du ligand, la nomenclature enzymatique et la structure du médicament, la classe thérapeutique, l'état de développement clinique. Toutes les informations fournies sont entièrement référencées.


Base de données sur les cibles potentielles de médicaments (PDTD)
REMARQUE: je pense que celui-ci est couplé à DrugBank mais vous pouvez jeter un œil ici

PDTD est une base de données à double fonction qui associe une base de données informatique à une base de données structurelle de cibles médicamenteuses connues et potentielles. PDTD est une base de données complète et accessible sur le Web de cibles médicamenteuses, et se concentre sur les cibles médicamenteuses avec des structures 3D connues.


PharmaGKB

Le PharmGKB est une ressource de connaissances en pharmacogénomique qui englobe des informations cliniques, notamment des directives posologiques et des étiquettes de médicaments, des associations gène-médicament potentiellement exploitables en clinique et des relations génotype-phénotype. PharmGKB recueille, conserve et diffuse des connaissances sur l'impact de la variation génétique humaine sur les réponses aux médicaments à travers les activités suivantes : Organiser les étiquettes de médicaments de la FDA contenant des informations pharmacogénomiques Permettre à des consortiums d'examiner des questions importantes en pharmacogénomique Organiser et participer à la rédaction de directives de dosage des médicaments basées sur la pharmacogénomique Contribuer aux projets de mise en œuvre clinique de la pharmacogénomique par le biais de collaborations Publier des directives de dosage des médicaments basées sur la pharmacogénomique, des résumés pharmacogéniques très importants et centrés sur les médicaments parcours Afficher toutes les informations sur le site Web et fournir des téléchargements complets


POINT

Pour faciliter l'accès à ces données, STITCH (« outil de recherche d'interactions de produits chimiques ») intègre des informations sur les interactions issues des voies métaboliques, des structures cristallines, des expériences de liaison et des relations médicament-cible. Les informations déduites des effets phénotypiques, de l'exploration de texte et de la similarité de la structure chimique sont utilisées pour prédire les relations entre les produits chimiques. STITCH permet en outre d'explorer le réseau de relations chimiques, également dans le contexte des protéines de liaison associées. Chaque interaction proposée peut être retracée jusqu'aux sources de données d'origine. Notre base de données contient des informations sur les interactions pour plus de 68 000 produits chimiques différents, dont 2 200 médicaments, et les relie à 1,5 million de gènes à travers 373 génomes et leurs interactions contenues dans la base de données STRING.


SuperTarget et Metador

Une interface de requête facile à utiliser permet à l'utilisateur de poser des requêtes complexes, par exemple pour trouver des médicaments qui ciblent une certaine voie, des médicaments en interaction qui sont métabolisés par le même cytochrome P450 ou des médicaments qui ciblent la même protéine mais sont métabolisés par différentes enzymes . De plus, nous fournissons des outils pour le criblage de médicaments 2D et la comparaison de séquences des cibles. La base de données contient plus de 2500 protéines cibles, qui sont annotées avec environ 7300 relations avec 1500 médicaments ; la grande majorité des entrées ont des pointeurs vers la source de littérature respective. Un sous-ensemble de ces médicaments a été annoté avec des informations contraignantes supplémentaires et des interactions indirectes et est disponible en tant que ressource distincte appelée Matador.


Pharos

Pharos est l'interface utilisateur du Knowledge Management Center (KMC) pour le programme Illuminating the Druggable Genome (IDG) financé par le Fonds commun des National Institutes of Health (NIH). (Subvention n° 5U54CA189205-02). L'objectif de KMC est de développer une base de connaissances complète et intégrée pour le génome médicamenteux (DG) afin d'éclairer la partie non caractérisée et/ou mal annotée du DG, en se concentrant sur quatre des familles de protéines les plus couramment ciblées par les médicaments : les récepteurs couplés aux protéines (GPCR) ; les récepteurs nucléaires (NR) ; canaux ioniques (CI); et les kinases. Pour plus d'informations sur les opportunités dans le génome humain médicamenteux, voir cette affiche


Médicament KEGG

KEGG DRUG est une ressource complète d'informations sur les médicaments pour les médicaments approuvés au Japon, aux États-Unis et en Europe, unifiée sur la base des structures chimiques et/ou des composants chimiques, et associée à la cible, à l'enzyme métabolisante et à d'autres informations sur le réseau d'interaction moléculaire. Tous les médicaments commercialisés au Japon, non seulement les médicaments sur ordonnance mais aussi les médicaments en vente libre, sont entièrement représentés dans KEGG DRUG et intégrés aux informations de la notice (informations sur les étiquettes). Ceux-ci incluent les médicaments bruts et les médicaments MTC (médecine traditionnelle chinoise).


Le guide IUPHAR/BPS de PHARMACOLOGIE (base de données)

Les informations de la base de données sont présentées à deux niveaux : la vue initiale ou les pages de destination pour chaque famille cible fournissent des aperçus organisés par des experts des propriétés clés et des ligands sélectifs et des composés d'outils disponibles. Pour les cibles sélectionnées, des chapitres d'introduction plus détaillés pour chaque famille sont disponibles ainsi que des informations sur les propriétés pharmacologiques, physiologiques, structurelles, génétiques et physiopathologiques de chaque cible. La base de données est enrichie d'hyperliens vers des informations supplémentaires dans d'autres bases de données, notamment Ensembl, UniProt, PubChem, ChEMBL et DrugBank, ainsi que d'informations chimiques et de citations de la littérature dans PubMed.


DGIBd

Le génome médicamenteux peut être défini comme les gènes ou les produits géniques qui sont connus ou prédits pour interagir avec des médicaments, idéalement avec un bénéfice thérapeutique pour le patient. Ces gènes sont d'un intérêt particulier pour les efforts de profilage du cancer à grande échelle tels que TCGA, ICGC et d'autres qui identifient des listes de gènes potentiellement responsables du cancer à partir de séquences à haut débit et d'autres données à l'échelle du génome. Dans le traitement du cancer, le nombre croissant de médicaments ciblés - ceux conçus pour inactiver les protéines portant des changements d'acides aminés activants tels que déterminés par des analyses mutationnelles - rend plus impérieux le besoin d'une base de données consultable sur les interactions médicament-gène, disponible ici.


Il y a beaucoup plus de bases de données, peut-être que ces liens vous aideront :


Interaction des cibles médicamenteuses : une analyse en réseau des maladies humaines et des cibles médicamenteuses

Le criblage et l'identification d'une nouvelle cible médicamenteuse spécifique à une maladie sont la première étape vers une approche rationnelle de conception de médicaments. En raison de l'avènement des techniques de génération de données à haut débit, l'espace de recherche de protéines a maintenant dépassé 24 500 gènes codant pour des protéines humaines, qui codent environ 1804 protéines. Ce travail vise à explorer la relation entre les protéines cibles, les médicaments et les gènes des maladies grâce à une approche de biologie des systèmes basée sur les réseaux. Un réseau de tous les médicaments approuvés par la FDA, ainsi que leurs cibles, ont été utilisés pour construire le réseau de cibles de médicaments (DT) proposé. De plus, les médicaments expérimentaux ont été mappés dans le réseau DT pour déduire la relation fonctionnelle en utilisant les attributs de réseau respectifs. Semblable au réseau DT, un réseau de gènes de maladies a été créé via OMIM Gene Map et Morbid Map, pour relier les associations binaires de gènes de trouble-maladie. Dans le modèle proposé de Human Interactome Network, le chemin le plus court entre la protéine cible et le gène de la maladie a été utilisé pour déduire la corrélation entre les « cibles médicamenteuses » et « le gène de la maladie ». Cette étude basée sur un réseau aidera les chercheurs à analyser, déduire et identifier de nouvelles cibles médicamenteuses spécifiques à une maladie en exploitant les attributs de réseau basés sur la théorie des graphes.

Mots clés: Maladie-Gène Médicament cible FDA Maladie humaine OMIM Interaction protéine-protéine Protéine cible..


Résumé de l'auteur

La découverte de médicaments modernes nécessite la compréhension de la chimiogénomique, l'interaction complexe de composés chimiques et de médicaments avec une grande variété de cibles protéiques et de gènes dans le corps. Une grande quantité de données relatives à de telles relations existe dans des ensembles de données accessibles au public, mais elles sont cloisonnées et donc impossibles à utiliser de manière intégrée. Dans ce travail, nous avons intégré et annoté sémantiquement une grande quantité de données publiques provenant d'un large éventail de bases de données, y compris composé-gène, médicament-médicament, protéine-protéine, effets secondaires des médicaments, etc., pour créer un réseau complexe d'interactions. concernant les composés et les cibles protéiques. Nous avons développé un algorithme statistique appelé Semantic Link Association Prediction (SLAP) pour prédire les « chaînons manquants » dans ce réseau de données : c'est-à-dire les interactions composées-cibles pour lesquelles il n'y a pas de données expérimentales mais qui sont statistiquement probables compte tenu des autres relations qui existent dans cet ensemble. . Nous présentons des expériences de validation qui montrent que cette méthode fonctionne avec un degré élevé de précision, et montrons également comment elle peut être utilisée pour créer un réseau de similarité de médicaments afin de prédire de nouvelles indications pour des médicaments existants.

Citation: Chen B, Ding Y, Wild DJ (2012) Évaluation d'une association de cibles médicamenteuses à l'aide de données liées sémantiques. PLoS Comput Biol 8(7) : e1002574. https://doi.org/10.1371/journal.pcbi.1002574

Éditeur: Alexander Tropsha, Université de Caroline du Nord, États-Unis d'Amérique

A reçu: 22 novembre 2011 Accepté: 7 mai 2012 Publié : 5 juillet 2012

Droits d'auteur: © 2012 Chen et al. Il s'agit d'un article en libre accès distribué selon les termes de la licence d'attribution Creative Commons, qui permet une utilisation, une distribution et une reproduction sans restriction sur n'importe quel support, à condition que l'auteur et la source d'origine soient crédités.

Le financement: BC et DJW ont été soutenus par une subvention sans restriction de Pfizer Global Research and Development. YD est soutenu par le projet VIVO financé par les NIH (UF09179). Les bailleurs de fonds n'ont joué aucun rôle dans la conception de l'étude, la collecte et l'analyse des données, la décision de publier ou la préparation du manuscrit.

Intérêts concurrents : Les auteurs ont déclaré qu'ils n'existaient pas de conflit d'intérêts.


2 MATÉRIAUX

2.1 Données sur les interactions médicament-cible

Nous avons obtenu des informations sur les interactions entre les médicaments et les protéines cibles du KEGG BRITE (Kanehisa et al., 2006), BRENDA (Schomburg et al., 2004), SuperTarget (Gunther et al., 2008) et DrugBank (Wishart et al., 2008) bases de données. Au moment de la rédaction de Yamanishi et al. (2008), le nombre de médicaments connus ciblant les enzymes, les canaux ioniques, les GPCR et les récepteurs nucléaires était de 445, 210, 223 et 54, respectivement. Le nombre de protéines cibles dans ces classes s'est avéré être 664, 204, 95 et 26 et le nombre d'interactions connues était de 2926, 1476, 635 et 90, respectivement. Nous avons travaillé avec exactement le même ensemble de données que Yamanishi et al. (2008) afin de faciliter les comparaisons de référence entre les deux méthodes. De plus amples détails sur la conservation de ces données ainsi que diverses statistiques sur les propriétés des quatre réseaux d'interaction médicament-cible sont donnés dans Yamanishi. et al. ( 2008).

2.2 Données chimiques

Les structures chimiques des composés proviennent des sections DRUG et COMPOUND de la base de données KEGG LIGAND (Kanehisa et al., 2006). Nous avons calculé la similarité de structure chimique entre les composés en utilisant SIMCOMP (Hattori et al., 2003), qui fournit un score de similarité global basé sur la taille des sous-structures communes entre les composés à l'aide d'un algorithme d'alignement de graphes. Dans cet algorithme, la similitude entre les composés c et c' est donné par sc(c, c′)=|cc′|/|cc|. En appliquant cette opération à toutes les paires composées, nous avons construit une matrice de similarité notée par Sc, qui est considéré comme représentant l'espace chimique.

2.3 Données génomiques

Les séquences d'acides aminés des protéines cibles ont été obtenues à partir de la base de données KEGG GENES (Kanehisa et al., 2006). Dans cette étude, nous nous sommes concentrés sur les protéines humaines. Nous avons calculé les similitudes de séquences entre les protéines en utilisant une version normalisée des scores de Smith-Waterman (Smith et Waterman, 1981). Le score de Smith-Waterman normalisé entre deux protéines g et g′ est donné par ⁠ , où SW(·, ·) désigne le score original de Smith-Waterman. En appliquant cette opération à toutes les paires de protéines, nous avons construit une matrice de similarité notée Sg, qui est considéré comme représentant l'espace génomique.


DISCUSSION

Le processus de découverte de médicaments reste un défi complexe dans lequel l'intégration systématique des données peut aider à dévoiler de nouvelles découvertes. Bien que des progrès aient été réalisés dans l'amélioration des normes de données (par exemple grâce à des efforts tels que l'Alliance mondiale pour la génomique et la santé (https://www.ga4gh.org/genomic-data-toolkit/), Elixir (https://elixir- europe.org/services/tag/interoperability-and-standards) et la Gene Curation Coalition https://thegencc.org/), l'harmonisation des différents jeux de données biomédicales constitue toujours l'un des principaux goulots d'étranglement lorsqu'il s'agit d'interpréter les connaissances disponibles. Plusieurs autres ressources dont Pharos ( 35), Disgenet ( 36) ou CanSAR ( 37) ont récemment abordé le problème de priorisation des cibles, apportant une vision complémentaire compte tenu de leurs domaines d'expertise respectifs ( 38). La plate-forme Open Targets vise à aider à relever ce défi en fournissant aux utilisateurs une interprétation systématique à jour des ressources pertinentes dans tous les domaines thérapeutiques et, en fin de compte, à combler le fossé des connaissances avec les données générées au sein du consortium Open Targets.

En étendant la plate-forme Open Targets à de nouvelles entités telles que les médicaments, nous espérons améliorer la capacité de notre modèle de données à capturer des informations afin de mieux répondre aux questions du monde réel. Cela nous a permis d'incorporer des informations importantes sur les médicaments et les composés, telles que le mode d'action, les indications approuvées et expérimentales, les représentations de petites molécules ainsi que l'analyse des effets indésirables post-commercialisation. Les informations de cible améliorées comprennent des informations sur les sondes chimiques et les packages d'activation de cible. L'adoption de la version 3 d'EFO a joué un rôle crucial dans l'augmentation du nombre d'associations cible-maladie au sein de la plate-forme. L'ontologie élargie permet d'incorporer de nouvelles associations cible-maladie directes à partir des sources de données, ainsi que des associations « indirectes » où les preuves sont appliquées dans toute la structure ontologique de la classification des maladies. A titre d'exemple, cela peut être utile aux utilisateurs intéressés par des cibles qui ont été associées à un large domaine thérapeutique, ou au contraire à une maladie très spécifique. Il permet également la collecte de preuves pour une cible pour un domaine thérapeutique donné, lorsque les annotations de preuves peuvent être rares pour les maladies individuelles qui en relèvent.

Nous avons continué à mettre à jour les preuves des associations cible-maladie grâce à des publications de routine de nos fournisseurs de données, ainsi que des preuves expérimentales supplémentaires générées par les projets Open Targets (tels que Project Score) et les analyses génétiques statistiques du portail Open Targets Genetics. Cela a inclus des informations sur les essais cliniques et les cibles de médicaments pour COVID-19 afin d'aider à identifier des cibles pour la réutilisation de médicaments existants ou le développement de nouveaux traitements pour aider à lutter contre la pandémie. Nous avons examiné et réitéré notre notation des preuves et amélioré la hiérarchisation des cibles pour des maladies particulières avec l'ajout d'informations sur la traçabilité et la sécurité générées par les projets informatiques Open Targets. Nous mettons en œuvre une refonte de l'infrastructure du portail, des pipelines de données et du frontend pour améliorer la convivialité et permettre une plus grande complexité des données pour l'avenir.

L'émergence de nouvelles technologies à grande échelle avec une granularité accrue des preuves (par exemple scRNAseq ou CRISPR), ainsi que l'intérêt croissant pour la stratification des maladies sur la base de ces lectures phénotypiques ou d'autres, présentent des défis que la plate-forme cherchera à relever dans un proche avenir à travers adaptation de notre modèle de données et de nouvelles façons de représenter les données. Déterminer l'importance relative de différents éléments de preuve lors de la combinaison des informations disponibles pour suggérer des cibles potentiellement efficaces pour la découverte de médicaments est un autre défi. L'inclusion de nouvelles sources de données systématiques, telles que les données GWAS de pointe du portail Open Targets Genetics, a révélé la nécessité de pondérer et de comparer de manière appropriée les preuves notées par rapport à d'autres sources de données orthogonales, une tâche difficile en raison du manque de étalons or appropriés. De plus, des études récentes ont mis en évidence l'utilité d'étendre les preuves déterminées expérimentalement à l'aide de réseaux d'interaction protéique (39, 40). Les données du réseau peuvent aider à contourner des problèmes tels que les cibles non traitables ou les responsabilités en matière de sécurité, ainsi qu'à identifier de nouvelles cibles fonctionnellement liées sans preuve préalable. Nous explorons donc différentes approches pour exploiter davantage les preuves des maladies cibles de la plate-forme dans le contexte de leurs interactions moléculaires.

Pour relever un ensemble diversifié de défis et pour garantir que les données au sein de la plate-forme restent à la pointe pour éclairer la prise de décision en matière de découverte de médicaments, nous travaillerons aux côtés de nos fournisseurs de données et des membres du consortium Open Targets pour introduire des solutions innovantes pour le identification systématique et hiérarchisation des cibles sur la base de données diverses et complexes accessibles au public.


La base de données sur les médicaments ciblés permet aux chercheurs de faire correspondre les anciens médicaments aux nouveaux usages

Il existe des milliers de médicaments qui réduisent au silence des milliers d'anomalies génétiques cancérigènes. Certains de ces médicaments sont actuellement utilisés, mais bon nombre d'entre eux sont sur des étagères ou pourraient être utilisés au-delà de la maladie pour laquelle ils ont été initialement approuvés. La réutilisation de ces médicaments dépend de l'appariement des médicaments aux cibles.

Une étude récemment publiée dans la revue Bioinformatique décrit une nouvelle base de données et un algorithme de mise en correspondance de modèles qui permettent aux chercheurs d'évaluer des médicaments et des combinaisons de médicaments rationnels, et recommande également une nouvelle combinaison de médicaments pour traiter le cancer du poumon non à petites cellules résistant aux médicaments.

"La plupart des cancers ont plus d'une alternance génétique. Et même les médicaments génétiquement ciblés ont tendance à affecter plus que leur cible déclarée. Le défi consiste donc à faire correspondre les médicaments ayant de nombreux effets aux cancers ayant de nombreuses causes d'une manière qui cartographie au mieux les effets des médicaments sur les cibles visées », explique Aik Choon Tan, PhD, chercheur au University of Colorado Cancer Center et professeur agrégé de bioinformatique à la CU School of Medicine.

Il existe environ 500 kinases dans le génome humain, chacune représentant une cible médicamenteuse potentiellement importante. Tan décrit la base de données comme une feuille de calcul avec 500 colonnes, chaque colonne représentant une kinase. En-tête de chaque ligne se trouve un médicament, puis dans chaque cellule de colonne se trouve l'activité de ce médicament contre la kinase.

"Imaginez que vous sachiez qu'un cancer est causé par cinq kinases agissant à l'unisson", dit Tan. "Notre approche vous permettrait d'interroger la base de données pour ce modèle et de découvrir le médicament ou la combinaison de médicaments qui correspondent le mieux aux besoins génétiques."

Étant donné que bon nombre de ces médicaments ont déjà obtenu l'approbation de la FDA pour une utilisation dans d'autres maladies, les processus de repositionnement de ces médicaments pour de nouvelles maladies sont beaucoup moins complexes et coûteux que si les développeurs de médicaments avaient commencé à zéro.

Tan et ses collègues ont utilisé la technique pour recommander des médicaments qui pourraient désactiver les kinases que le cancer du poumon non à petites cellules utilise pour créer une résistance aux traitements existants. C'est une question importante - de nombreux cancers du poumon dépendent de la suractivation du gène EGFR, mais lorsque des inhibiteurs de l'EGFR comme le gefitinib ou l'erlotinib sont utilisés, les cancers ont tendance à activer d'autres « kinases » qui permettent au cancer de contourner cette dépendance. Tan et ses collègues ont demandé quelles sont ces kinases qui permettent au cancer du poumon d'échapper au géfitinib, et quel autre médicament pourrait les désactiver.

La réponse se trouve peut-être dans le médicament bosutinib, développé par Pfizer, qui a obtenu l'approbation de la FDA en 2013 pour le traitement de la leucémie myéloïde chronique. Le médicament surpasse la source d'énergie du corps, l'ATP, pour l'espace dans les kinases et les empêche ainsi d'être activées. Et il s'avère que le bosutinib peut inhiber l'activité d'exactement les kinases dont les cancers du poumon EGFR-dépendants ont besoin pour muter autour du défi des inhibiteurs de l'EGFR.

Dans des tests sur des lignées cellulaires de cancer du poumon dépendantes de l'EGFR, Tan et ses collègues montrent que les médicaments gefitinib et bosutinib "ont montré des effets additifs et synergiques".

Dans un mécanisme que Tan espère deviendra commun, son groupe va maintenant transmettre cette combinaison rationnelle à d'autres chercheurs du CU Cancer Center et d'ailleurs qui déplaceront les médicaments vers un essai clinique humain.


Dispositifs microfluidiques pour la découverte et l'analyse de médicaments

Synthèse de bibliothèques de médicaments

La reconnaissance des cibles médicamenteuses a suivi le rythme des progrès rapides des outils génomiques et protéomiques. D'autre part, les sociétés pharmaceutiques sont confrontées à des défis pour générer des composés médicamenteux au rythme le plus rapide possible, de manière peu coûteuse. La synthèse de bibliothèques de médicaments a été décrite comme le plus grand obstacle au processus de découverte de médicaments ( Jones et al., 2005 ). Des méthodes améliorées en chimie combinatoire ont abouti à la synthèse rapide d'un grand nombre de composés chimiques et ont produit d'énormes bibliothèques de médicaments. Cela a été encore accéléré par l'amélioration de la conception des réacteurs microfluidiques. Ces réacteurs microfluidiques peuvent être classés en trois types, en fonction du modèle d'écoulement, à savoir (i) le type à écoulement continu, (ii) le type gouttelette ou lingot, et (iii) le type discontinu. Le type d'écoulement le plus courant permet à plusieurs réactifs d'être maintenus à une température et d'être entraînés sous pression à travers les canaux. Ces réacteurs ont été largement utilisés dans les procédures d'extraction ainsi que dans de multiples synthèses chimiques ( Keng et al., 2012).

La synthèse combinatoire parallèle dans plusieurs réacteurs microfluidiques a également été démontrée en utilisant le flux continu de réactifs dans les canaux microfluidiques. Un assemblage de réacteurs microfluidiques multiples a été fabriqué pour synthétiser des carbamates dans une procédure en plusieurs étapes ( Sahoo et al., 2007 ). Cependant, cette méthode sacrifie les avantages d'un système intégré pour que plusieurs réactions soient effectuées sur une seule puce. Les chercheurs ont ensuite cherché à fabriquer un dispositif consolidé avec plusieurs couches de puces parallèles. Une puce en verre multicouche a été développée pour une synthèse série 2 × 2 en parallèle ( Kikutani et al., 2002 ). La complexité et le coût de fabrication de ce dispositif multicouche étaient une préoccupation. Récemment, Dexter et Parker ont présenté une synthèse combinatoire parallèle de composés sur une puce microfluidique monocouche (Fig. 7.3a). Ils ont fabriqué une puce PDMS à couche unique pour synthétiser une série 2 × 2 de produits de formation d'amide ( Dexter et Parker, 2009 ).

7.3. Différents types de réacteurs microfluidiques. (a) Un réacteur à flux microfluidique continu à base de PDMS pour une synthèse combinatoire parallèle 2 × 2. La tubulure a été insérée à chaque orifice d'entrée et de sortie ( Dexter et Parker, 2009 ). (b) Micrographie optique d'un réacteur microfluidique de type batch avec dimension réelle (en médaillon) ( Lee et al., 2005 ).(c) Schéma d'un manipulateur de microgouttelettes, y compris les fonctions pour (i) la génération de gouttelettes, (ii) le transfert de gouttelettes vers un réseau de micropuits, (iii) la migration des gouttelettes dans les puits, (iv) le piégeage des deuxièmes gouttelettes et (v) changement d'huile pour induire la fusion des gouttelettes ( Um et al., 2012 ).

Cependant, les réacteurs à flux continu ne sont pas adaptés aux réactions à plusieurs étapes, en particulier celles impliquant une synthèse séquentielle. Une technique modifiée, appelée microfluidique par lots, dans laquelle des microvannes spécifiques contrôlent la livraison de réactifs par lots, a été développée. Ces lots isolés peuvent être livrés à la chambre du réacteur microfluidique à des moments précis dans un cycle de réaction, exerçant un meilleur contrôle sur la réaction ( Lee et al., 2005). Une sonde d'imagerie radiomarquée au fluorure, à l'échelle nano/microgramme, a été synthétisée dans cinq processus séquentiels impliquant la concentration de fluorure, l'évaporation de l'eau, la radiofluoration, l'échange de solvant et la déprotection hydrolytique (Fig. 7.3b).

Une technologie plus récente, connue sous le nom de microfluidique en gouttelettes, a récemment fait son apparition. Elle est basée sur la compartimentation de chaque dosage dans une petite gouttelette, généralement de l'ordre de 1 pL à 10 nL, entourée d'une huile non miscible, qui peut être manipulée et traitée à haut débit ( Brouzes, 2012 ). Chacune de ces gouttelettes peut agir comme un minuscule réacteur microfluidique, réduisant notamment les volumes de réactifs nécessaires. Un réseau de micropuits à mailles a été fabriqué par Um et al., qui permet l'ajout et le piégeage continus de gouttelettes monocellulaires de picolitre dans les micropuits ( Fig. 7.3c ). En raison de la miniaturisation, l'appareil fournit un criblage à haut débit des gouttelettes ( Um et al., 2012 ), mais les réactions en plusieurs étapes utilisant ces dispositifs restent un grand défi.

De plus, ces réacteurs microfluidiques ont également été utilisés pour la synthèse de molécules biologiques, telles que l'ADN. De courts oligonucléotides synthétiques ont été joints sous cyclage thermique dans un dispositif microfluidique picoArray pour former instantanément des constructions d'ADN jusqu'à 10 kb. Il a été démontré que la construction d'ADN fabriquée exprime des protéines pertinentes et peut être utilisée pour l'expression de protéines sans cellules à grande échelle ( Zhou et al., 2004 ). Mei et al. a développé un dispositif de réseau microfluidique pour la synthèse de la chloramphénicol acétyl-transférase et de la luciférase, et a rapporté que le rendement était 13 à 22 fois supérieur à celui obtenu dans un tube de microcentrifugation, avec une expression protéique 5 à 10 fois plus longue. Le dispositif est composé d'un ensemble d'unités permettant la fabrication de différentes protéines, l'expression des protéines et l'apport de nutriments. L'appareil est également capable de synthétiser et d'analyser des protéines sur une seule puce, éliminant potentiellement le besoin de récolter des protéines, réduisant ainsi le gaspillage et augmentant l'efficacité du processus ( Mei et al., 2007 ). Une méthode microfluidique à base de gouttelettes a été récemment développée pour la synthèse de protéines sur puce. La production d'une émulsion eau-dans-huile-dans-eau (E/H/E) a été réalisée par la formation d'une émulsion eau-dans-huile sur une puce de poly (méthacrylate de méthyle), en premier lieu, suivie de la formation complète d'émulsion sur une puce PDMS/verre. La synthèse et l'expression d'une protéine fluorescente verte à partir d'une matrice d'ADN ont été démontrées avec succès à l'aide d'une plateforme microfluidique (Wu et al., 2011 ).

La plupart des dispositifs développés utilisent le PDMS comme matériau de substrat en raison de ses excellentes propriétés optiques ainsi que de sa moulabilité. Cependant, le PDMS est incompatible avec de nombreux solvants organiques et adsorbe de nombreux composés hydrophobes en raison de ses propriétés de surface. Keng et al. a fabriqué une plate-forme microfluidique qui fonctionne par électromouillage sur diélectrique (EWOD). Le dispositif a été fabriqué à partir de matériaux inorganiques recouverts de polymère perfluoré et offre une flexibilité d'utilisation avec des réactifs organiques et hydrophobes ( Keng et al., 2012 ). Le dispositif s'est avéré adapté à diverses réactions chimiques avec une consommation minimale de réactifs, avec une adéquation aux procédures en plusieurs étapes nécessitant plusieurs cycles d'échange de solvant.

Ces dispositifs ont été utilisés efficacement pour générer des bibliothèques de médicaments, qui constituent une source puissante qui doit être criblée pour explorer de nouveaux médicaments. Pour cribler ces grandes bibliothèques combinatoires de composés, l'industrie pharmaceutique a examiné des méthodologies de criblage à haut débit (HTS) au cours des deux dernières décennies. Les méthodes de criblage conventionnelles ont permis de cribler de 5 000 à 20 000 composés en quelques années, ce qui a entraîné un criblage inefficace de seulement 2 à 20 % des composés sur l'ensemble de la bibliothèque. Cependant, les méthodologies HTS, ou nouvellement appelées criblage à ultra-haut débit (uHTS), visent à cribler 10 000 à 100 000 composés sur une période de 24 h, ce qui entraîne la génération de 2 à 18 millions de résultats de criblage par an (Beggs, 2001). . Cette augmentation logarithmique de la capacité de criblage a stimulé le processus de découverte hit-to-lead.


Base de données pour la relation médicament-cible - Biologie

Tous les articles publiés par MDPI sont rendus immédiatement disponibles dans le monde entier sous une licence en libre accès. Aucune autorisation particulière n'est requise pour réutiliser tout ou partie de l'article publié par MDPI, y compris les figures et les tableaux. Pour les articles publiés sous licence Creative Common CC BY en accès libre, toute partie de l'article peut être réutilisée sans autorisation à condition que l'article original soit clairement cité.

Les articles de fond représentent la recherche la plus avancée avec un potentiel important d'impact élevé dans le domaine. Les articles de fond sont soumis sur invitation individuelle ou sur recommandation des éditeurs scientifiques et font l'objet d'un examen par les pairs avant leur publication.

L'article de fond peut être soit un article de recherche original, soit une nouvelle étude de recherche substantielle qui implique souvent plusieurs techniques ou approches, ou un article de synthèse complet avec des mises à jour concises et précises sur les derniers progrès dans le domaine qui passe systématiquement en revue les avancées les plus passionnantes dans le domaine scientifique. Littérature. Ce type d'article donne un aperçu des orientations futures de la recherche ou des applications possibles.

Les articles du Choix de l'éditeur sont basés sur les recommandations des éditeurs scientifiques des revues MDPI du monde entier. Les rédacteurs en chef sélectionnent un petit nombre d'articles récemment publiés dans la revue qui, selon eux, seront particulièrement intéressants pour les auteurs ou importants dans ce domaine. L'objectif est de fournir un aperçu de certains des travaux les plus passionnants publiés dans les différents domaines de recherche de la revue.


Résumé

La prédiction de l'interaction médicament-cible (DTI) est une étape difficile dans le repositionnement ultérieur des médicaments, la découverte de médicaments et la conception de médicaments. L'avènement des technologies à haut débit facilite le développement de méthodes de prédiction DTI. Avec la génération d'un grand nombre d'ensembles de données, de nombreux modèles mathématiques et algorithmes de calcul ont été développés pour identifier les paires médicament-cible potentielles. Cependant, la plupart des méthodes existantes sont proposées sur la base des données de vue unique. En intégrant le médicament et les données cibles de différentes vues, nous visons à obtenir des résultats de prédiction plus stables et plus précis.

Dans cet article, une méthode de prédiction DTI multivue basée sur le clustering est proposée. Nous introduisons d'abord un modèle pour les données de cible médicamenteuse à vue unique. Le modèle est formulé comme un problème d'optimisation, qui vise à identifier les clusters à la fois dans le réseau de similarité des médicaments et dans le réseau de similarité des protéines cibles, et en même temps faire en sorte que les clusters avec les DTI les plus connus soient connectés ensemble. Ensuite, le modèle est étendu aux données de réseau à vues multiples en maximisant la cohérence des clusters dans chaque vue. Une méthode d'approximation est proposée pour résoudre le problème d'optimisation. Nous appliquons les algorithmes proposés à deux vues de données. Des comparaisons avec certains algorithmes existants montrent que l'algorithme de prédiction DTI multivue peut produire des prédictions plus précises. Pour l'ensemble de données considéré, nous prédisons finalement 54 DTI possibles. À partir de l'analyse de similitude des médicaments/cibles, de l'analyse d'enrichissement des DTI et des gènes dans chaque groupe, il est démontré que les DTI prédits ont une forte probabilité d'être vrais.


Conclusion

Dans ce travail, nous proposons un modèle basé sur des blocs d'attention multiples pour (i) améliorer les informations de position relative entre les atomes lors de l'encodage de médicaments et (ii) modéliser l'interaction entre les représentations de médicaments et les représentations cibles. Empirical results of the drug-target binding affinity prediction task on two benchmark datasets demonstrate the effectiveness of our proposed methods. The extensive analyses suggest that (i) encoding the relative position information is beneficial to drug representations, (ii) modeling the interaction can further improve the performance of predicting the binding affinity of DITs and (iii) the best max relative position length to encode drugs is in 3𠄵 for the KIBA and Davis dataset. Furthermore, we apply our trained model to predict the binding affinity scores of SARS-CoV-2-related genome sequences and FDA-approved drugs to provide some reference for COVID-19-related scientists.

Points clés

MATT_DTI is a deep learning-based model for drug-target binding affinity score prediction.

In order to encode the correlation between atoms of drugs, MATT_DTI employs a relation-aware self-attention block to enhance the relative information between atoms when encoding drug compounds.

In order to extract interaction feature of drug-target pairs, a multi-head attention block is proposed to model the similarity between drugs and target in MATT_DTI.

Experimental results of DTI prediction on two benchmark datasets show our MATT_DTI outperforms existing models, which is benefit from the correlation and interaction information.

We further apply our model to FAD-approved drugs and COVID-19-related proteins, which could provide a reference to medical expert.


Voir la vidéo: Bases de Données Relationnelles - Schéma EntitéAssociation 13 - Notion de lEntité (Janvier 2022).