Espace de travail (Molegro)

Les fichiers workspace de Molegro et leur format MVDML ont l’air bien compliqués. En fait il n’en est rien, il suffit de les explorer avec un éditeur de texte et d’avoir quelques notions de XML (Extensible Markup Language) pour s’en rendre compte. Reprenons le fichier frame_06_1P45a_NAD_Flex19_tmpl.mvdml  qui concerne la structure 1P45 [Kuo_2003] et plus particulièrement la chaine A de 1P45. Cet espace de travail inclue un cofacteur NAD, la protéine est paramétrée pour 19 résidus flexibles et des templates (profils pharmacophoriques). Le début du nom ‘frame_‘ nous indique que la structure est un peu plus que 1P45a et qu’elle est probablement issue d’un processus de biologie structurale. En fait, les informations sur la dynamique structurale de la protéine ont été regroupés dans une séquence de structures corrélées entre elles (version gen3 dans ce cas). Chaque structure est appelée une frame, cette structure est la frame 06 (sur 42, dans ce cas), cette structure correspond aussi à 1P45a.

Publication initiale sur buildblog.buidez.net (2021) – Article mis à jour en Mars 2025.

Navigation dans le guide

Guide [ Aide Molegro (docking) ]




1. Au niveau du format (XML)

Ce fichier .mvdml n’est pas autre chose qu’un fichier XML que l’on peut éditer avec un éditeur de texte, par exemple la première partie du fichier (sous l’éditeur SciTE) apparait dans l’image de gauche et la fin dans l’image de droite :

A gauche nous avons les numéros de ligne, à droite le fichier XML, avec différentes balises qui délimitent des blocs d’information qui forment une hiérarchie. Par exemple ProteinList est un bloc (ouvert par la balise <ProteinList> et fermé par la balise </ProteinList>) de niveau supérieur qui va contenir 2 blocs Protein, qui vont contenir à leur tour des blocs AtomList et des sous-blocs Atoms, BondList et Bonds, ResidueList et Residues … chaque bloc ou sous-bloc contenant des informations atomiques ou moléculaires.

2. Au niveau du ligand

La structure 1P45a inclue une molécule de TCL (triclosan), mais dans un espace de travail, nous pouvons trouver plusieurs ligands, qui sont intégrés en vue d’un arrimage moléculaire ou d’un criblage. Prenons le cas du bloc Ligand (balises <Ligand></Ligand>) correspondant à une molécule de JPL (un dérivé de TCL) dans le workspace :

Il s’agit du JPL_400_3FNG_ (résidu de numéro 400) issu de la structure 3FNG_ [Freundlich_2009] alignée avec 1P45a. La formulation n’est pas évidente, mais même sans connaître les types d’atomes TRIPOS (cf. note en fin d’article) avec la formule développée (image suivante, à droite) nous pouvons commencer à comprendre: triposAtomType="21" pour les hydrogènes, 28 pour les chlores, 14 pour les oxygènes (type="2" pour l’éther, type="3" pour l’hydroxyle), 4 pour les carbones aromatiques, 3 pour les autres carbones … et nous pouvons commencer à remonter dans les blocs d’information.

Sinon, à partir de Molegro, il suffit d’exporter le ligand au format MOL2 (SYBYL) qui correspond à ce paramétrage (image de gauche), comme beaucoup d’autres programmes de modélisation moléculaire ou d’arrimage :

Bloc de coordonnées (x,y,z) du JPL, format MOL2. Formule développée, hydrogénée et numérotée du JPL.

Dans ce cas  c’est plus simple, nous voyons bien les carbones aromatiques (chaines "C.ar" après les coordonnées cartésiennes). Molegro utilise un certain ordre pour le ligand, mais qui numérote les atomes de 0 à n-1 (valeur de l’élément id dans chaque bloc Atom). Une fois sauvé au format MOL2 (à ne pas confondre avec MDL Mol) l’ordre est conservé, il est bien rendu par ChemAxon Marvin (formule développée à droite) mais la numérotation est de 1 à n (il n’y a pas d’atome zéro dans une formule développée). Pour cette fois nous avons de la chance, l’ordre/id des atomes après passage dans plusieurs logiciels, est quelque chose qui est parfois fluctuant.

3. Edition en mode texte

Le workspace MVDML inclue aussi d’autres choses, comme les molécules d’eau (s’il y en a dans la structure et que nous les avons conservées) et des notes ou commentaires. Ces notes gardent une trace de l’origine des molécules importées, elles sont souvent utiles à consulter si nous nous sommes écartés de l’organisation du projet et que nous recherchons la provenance (logiciel, origine sur le disque …) de la structure.
Nous remarquons aussi que 2 protéines sont présentes dans le workspace : <ProteinList count="2" et <Protein name="Noname [A]" et <Protein name="Noname [A]_1". Sachant que c’est une duplication de la même structure suite a des erreurs d’importation, on peut supprimer le bloc correspondant à Noname [A]_1, ce qui allègera le workspace. On peut aussi renommer Noname [A] en frame_06_1P45a, par exemple. Sachant que l’on peut modifier un workspace à la main, cela veut dire qu’on peut aussi le faire via un programme, ce qui ouvre des perspectives intéressantes (que n’offrent pas toujours d’autres logiciels d’arrimage).

4. Conclusion

Au fur et à mesure de l’avancement du projet, le workspace peut incorporer de nouveaux ligands, donc nous trouverons très souvent, au niveau racine du projet, des espaces de travail associés à des numéros de version en fin de nom. Ils diffèrent les uns des autres par l’ajout de ligands et parfois des modifications dans les templates ou les résidus flexibles. Il est déconseillé de supprimer un ligand dans un espace de travail une fois que l’arborescence est établie, sinon toute la numérotation des ligands est perturbée. En effet, l’ordre d’apparition dans le workspace conditionne un numéro de ligand, qui est nécessaire pour lancer les calculs, et que nous utilisons aussi dans les noms de dossiers.

Liens et lectures
  • Extensible Markup Language [ https://fr.wikipedia.org/wiki/Extensible_Markup_Language ].
  • Triclosan [ https://fr.wikipedia.org/wiki/Triclosan ].
  • TRIPOS – Ce terme correspond à la fois à un champs de forces, à un paramétrage atomique, à une société. Tripos a été crée en 1979, restructurée: Tripos international, Tripos Discovery Research … SYBYL ® correspondait à une plateforme de modélisation moléculaire, à un format de fichiers MOL2, qui étaient au cœur de l’offre logicielle Tripos qui était orientée Drug Discovery et très large (suite logicielle composée de modules) en termes de fonctionnalités. En 2008 Tripos a fusionné avec une autre société pour devenir Certara [ https://www.certara.com/ ]. On trouve des publications qui citent encore les dernières versions de Sybyl-XF (2016) mais je n’ai pas d’autres éléments à donner.
Retour en haut