
Par Marie-Aude Guie, vice-présidente de l'informatique scientifique et de la science des données
L'intelligence artificielle (IA) est désormais reconnue comme un élément indispensable de la boîte à outils moderne de la découverte de médicaments, appliquée à toutes les étapes de la découverte de médicaments, depuis la recherche initiale de résultats jusqu'à l'optimisation des pistes et au-delà. Il a été démontré à maintes reprises que l'association de données de haute qualité et d'une intelligence artificielle avancée peut améliorer considérablement le processus de recherche de résultats.1,2,3 Mais alors que les avantages de l'IA dans la découverte de médicaments continuent de s'accumuler, nous devons nous rappeler que pour maximiser le potentiel de cette industrie, il faut aider les principaux contributeurs dans leurs efforts :
En bref, si nous voulons que la communauté de l'IA continue à soutenir la communauté de la découverte de médicaments, nous devons également soutenir la communauté de l'IA.
Pensez-y de cette façon : AlphaFold peut désormais prédire les structures tridimensionnelles des protéines avec plus de précision que jamais.4 Pourquoi ? Parce que les données d'entraînement ont été rendues publiques. Alors, comment améliorer encore les algorithmes d'IA ? Nous partageons les données, ce qui permet aux scientifiques de données d'explorer de nouvelles approches pour résoudre les problèmes liés à la découverte de médicaments.
Malheureusement, la plupart des entreprises ne partagent pas leurs données exclusives, ce qui se traduit par des ensembles de données publiques restreints et peu diversifiés. En outre, l'apprentissage machine (ML) nécessite à la fois des données positives et des données négatives. et Les données négatives pour les modèles efficaces, mais les ensembles de données publiques (par exemple, la littérature) ne comprennent souvent que des résultats positifs. Cela ne suffit pas.
Pour contribuer à résoudre ce problème, X-Chem prend des mesures pour montrer l'exemple et faire partie de la solution : En collaboration avec Consortium de génomique structurelle (SGC), X-Chem partagera publiquement ses données de criblage de bibliothèques codées par l'ADN (DEL). Les praticiens de l'IA auront un accès libre à ces données et pourront les utiliser pour tester de nouvelles approches d'IA. De plus amples informations sont disponibles à l'adresse suivante cette communiqué de presse.
Nous espérons que les données de haute qualité et à haut débit de X-Chem favoriseront également les progrès de l'IA, car l'IA a déjà amélioré diverses étapes de la découverte de médicaments. Grâce à ces nouveaux ensembles de données publiques, nous favoriserons également la validation des cibles par l'identification de sondes et nous explorerons des voies encore inexplorées pour la découverte de médicaments.
Notre mission est d'aider nos clients à guérir les maladies et de partager nos innovations avec le monde entier. Nous mettons déjà notre technologie entre les mains des experts en découverte de médicaments, et nous voulons maintenant faire de même pour la communauté de l'IA en mettant plus de données entre leurs mains. La plateforme DEL de X-Chem fournit une profondeur et une étendue sans précédent de données propres et diverses. Ces données seront désormais accessibles au public.
Références
- McCloskey, K. et al. Apprentissage automatique sur des bibliothèques codées en ADN : un nouveau paradigme pour la recherche de résultats. Journal of Medicinal Chemistry, J. Med. Chem. 2020, 63, 16, 8857-8866.
- Ahmad, S., et al. Découverte d'un premier ligand de petite molécule pour le WDR91 à l'aide d'une sélection de chimiothèques codées sur l'ADN suivie d'un apprentissage automatique. J. Med. Chem. 2023, 66, 23, 16051-16061.
- Li, A.S.M. et al. 2023. Découverte de petites molécules ligands nanomolaires pour le DCAF1. J. Med. Chem. 2023, 66, 7, 5041-5060.
- Bordin, N. et al. 2023. De nouvelles approches d'apprentissage automatique révolutionnent la connaissance des protéines. Tendances en sciences biochimiques, Trends in Biomedical Sciences. 2023, 48(4), 45-359.


