Les bibliothèques de petites molécules codées dans l'ADN (DEL) ont permis de découvrir de nouveaux inhibiteurs pour de nombreuses cibles protéiques distinctes présentant un intérêt thérapeutique. Nous démontrons une nouvelle approche appliquant l'apprentissage automatique aux données de sélection des DELs en identifiant des molécules actives à partir de grandes bibliothèques de composés commerciaux et facilement synthétisables. Nous formons des modèles en utilisant uniquement les données de sélection DEL et nous appliquons des filtres automatisés ou automatisables aux prédictions. Nous réalisons une vaste étude prospective (∼2000 composés) sur trois cibles protéiques diverses : sEH (une hydrolase), ERα (un récepteur nucléaire) et c-KIT (une kinase). L'approche est efficace, avec un taux de réussite global de ∼30% à 30 μM et la découverte de composés puissants (IC50 < 10 nM) pour chaque cible. Le système fait des prédictions utiles même pour les molécules dissemblables à la DEL originale, et les composés identifiés sont divers, principalement de type médicamenteux, et différents des ligands connus. Ce travail démontre une nouvelle approche puissante de la recherche de cibles.

