Recherches avancées de ligands dans la PDB

Les fichiers PDB incluent différents types de petites molécules : de l’eau, des ions, des molécules organiques ou inorganiques, qui peuvent être issues du tampon de cristallisation (artefacts) ou bien correspondre à des composés d’intérêt (euligands ou LOI: Ligands of Interest) : substrats, inhibiteurs, effecteurs, antagonistes, agonistes … qui correspondent à l’étude et non à un produit issu des conditions expérimentales. Il n’y a rien de péjoratif dans le terme artefacts, ils peuvent aussi se positionner dans des sites de liaisons et donner des indications. Tous ces ligands sont identifiés par un code PDB à trois lettres/chiffres, comme un résidu (RESNAME) protéique. Nous avons les moyens de faire des recherches par ou par structure, mais ce qui est intéressant c’est de voir ce que nous pouvons obtenir comme informations.

Publié en 2025 – Article mis à jour en Novembre 2025.

1. Via la PDB (rscb.ligand)

La plupart du temps, l’accès au ligand se fait via l’entrée PDB correspondant à une co cristallisation, par exemple la structure 1P45 inclue du triclosan (code TCL) et du NAD (code NAD). Si on connait ces codes, on peut attaquer directement la PDB via [ https://www.rcsb.org/structure/1P45 ] pour la protéine et [ https://www.rcsb.org/ligand/TCL ] pour la formule chimique et les données concernant le triclosan.

Informations générales

Ce qui va nous donner une page qui regroupe différentes informations sur le composé, les différents noms : PDB, usuel et synonymes, pharmaceutiques, chimique ( 5-chloro-2-(2,4-dichlorophenoxy)phenol), formule brute et quelques descripteurs : masse moléculaire, charges formelles, et quelques indices topologiques (nombre d’atomes, d’atomes chiraux, de liaisons, de liaisons aromatiques).

Structures chimiques

Nous avons aussi la possibilité de copier les formules développées sous différents formats, comme le montre la table suivante :

Type Programme Version Descripteur
SMILES ACDLabs 10.04 Clc2cc(Cl)ccc2Oc1ccc(Cl)cc1O
SMILES CACTVS 3.341 Oc1cc(Cl)ccc1Oc2ccc(Cl)cc2Cl
SMILES OpenEye OEToolkits 1.5.0 c1cc(c(cc1Cl)O)Oc2ccc(cc2Cl)Cl
Canonical SMILES CACTVS 3.341 Oc1cc(Cl)ccc1Oc2ccc(Cl)cc2Cl
Canonical SMILES OpenEye OEToolkits 1.5.0 c1cc(c(cc1Cl)O)Oc2ccc(cc2Cl)Cl
InChi InChI 1.03 InChI=1S/C12H7Cl3O2/c13-7-1-3-11(9(15)5-7)17-12-4-2-8(14)6-10(12)16/h1-6,16H
InChIKey InChI 1.03 XEFQLINVKFYRCS-UHFFFAOYSA-N

Il est possible d’accéder à la molécule au format SDF (Ideal SDF) par un menu spécialisé, il s’agit d’une structure 3D hydrogénée, nous reviendrons sur ce point plus tard.

Pointeurs sur d’autres bases

Nous avons aussi accès aux numéros DrugBank, à quelques propriétés issues de cette base, aux macromolécules cibles, si la molécule possède une activité.
Si la molécule est commercialisée, nous avons de grandes chances d’avoir accès aux numéros CAS.
Et enfin nous avons des pointeurs vers d’autres bases de données: Pharos, PubChem, ChEMBL, ChEBI, CCDC/CSD …

Recherche de ligands ‘voisins’ et de macromolécules cibles

Nous avons aussi la possibilité de faire des recherche sur les ligands qui possèdent une structure chimique similaire, avec différentes modalités. Dans le cas du TCL, à la date d’édition de l’article, et avec la recherche rapide (quick search) qui est la moins précise, nous obtenons 17 molécules. Et nous avons le plaisir de retrouver des dérivés du triclosan actifs sur InhA tels que 8PC, JPA, JPJ, JPL, JPM, JPN … ou d’autres ligands.

Il est également possible d’obtenir la liste des entrées PDB ou le ligand TCL apparaît. Dans ce cas nous avons une liste (34 éléments à la date d’édition de l’article) de structures (1C14, 1D7O, … 1P45, …, 6AH9, 7FCM ) comme si l’on faisait une recherche classique dans la PDB.

Liens et lectures
  • Triclosan dans DrugBank [ https://go.drugbank.com/drugs/DB08604 ].
Retour en haut