4. Un dictionnaire de blocs CONECT
Sur la page du Chemical Component Dictionary [ https://www.wwpdb.org/data/ccd ] nous trouvons une mention concernant une base de résidus qui fournit des blocs CONECT, au sens du format PDB :
Prior to development of the Chemical Component Dictionary, PDB chemical information was solely in the form of connection tables. This older representation, called the PDB HET dictionary, is still made available on the wwPDB ftp site.
Nous pouvons télécharger le fichier global het_dictionary.txt ou chaque résidu (monomers) selon deux adresses :
- HET Dictionary [ https://files.wwpdb.org/pub/pdb/data/monomers/het_dictionary.txt ].
- Résidus/Monomères [ https://files.wwpdb.org/pub/pdb/data/monomers/ ] ! Ce répertoire est long à afficher (nombres d’entrées).
Dans le cas du TCL nous aurons le bloc suivant :
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
RESIDUE TCL 24 CONECT C1 3 C2 C6 H11 CONECT C2 3 C1 C3 CL14 CONECT C6 3 C1 C5 O17 CONECT C5 3 C6 C4 O7 CONECT C4 3 C5 C3 H41 CONECT C3 3 C2 C4 H31 CONECT C11 3 C10 C12 CL15 CONECT C10 3 C11 C9 H101 CONECT C9 3 C10 C8 CL16 CONECT C8 3 C9 C13 O7 CONECT C12 3 C11 C13 H121 CONECT C13 3 C8 C12 H131 CONECT O7 2 C5 C8 CONECT CL14 1 C2 CONECT CL15 1 C11 CONECT CL16 1 C9 CONECT O17 2 C6 H171 CONECT H11 1 C1 CONECT H41 1 C4 CONECT H31 1 C3 CONECT H101 1 C10 CONECT H121 1 C12 CONECT H131 1 C13 CONECT H171 1 O17 END HET TCL 24 HETNAM TCL TRICLOSAN FORMUL TCL C12 H7 Cl3 O2 |
La molécule est hydrogénée, avec un lien vers le nom de résidu (champ RESIDUE + nombre d’atomes ou champ HET) et la formule brute (champ FORMUL). On peut trouver bizarre la nomenclature des 7 atomes d’hydrogènes dont certains sont supérieurs à 100. Il s’agit d’une convention qui suit la numérotation des atomes lourds adjacents. Par exemple l’Oxygène 17 porte l’hydrogène 1H17 (version V2) qui devient H117 dans la version V3. L’explication était donnée sur l’ancien site [ http://ligand-expo.rcsb.org/ld-search.html ], il s’agit d’un changement lié à la version 3 de la PDB :
The atom nomenclature in PDB data files was revised with the release of data in the PDB Format Version 3.0. These changes make the PDB atom names used by PDB compliant with existing IUPAC nomenclature for standard amino acid and nucleotides (Pure & Appl. Chem., 70, 117-142, 1998) with the exception of the well established convention for C-terminal atoms OXT and HXT. A small number of additional changes were introduced in Version 3 to make atom labeling more conventional.
Il faut noter que fort heureusement les fichiers SDF n’utilisent pas la même numérotation (cf. la première section de l’article) avec une numérotation plus conventionnelle de 1 à 24.
Liens et lectures
- [ IUPAC report ] – Markley JL, Bax A, Arata Y, Hilbers CW, Kaptein R, Sykes BD, Wright PE, Wüthrich K. Recommendations for the Presentation of NMR Structures of Proteins and Nucleic Acids (1998) Pure Appl. Chem., Vol. 70, No. 1, pp. 117-142 [ https://old.iupac.org/reports/1998/7001markley/ ].