Demande d'accompagnement sur un projet de docking

Avant de faire du docking, il sera important de valider la qualité de la structure du recepteur. Si c'est un modèle, a priori, le docking est risqué. Dans tous les cas, je vous recommande de faire attention aux conformations des chaînes latérales.
Vous pouvez aussi comparer les résultats obtenus avec DockingApp sur ceux du serveur MTiOpenScreen (service en ligne auquel if faut fournir un 3D du recepteur, une liste de composés au format smiles ou sdf)

@tuffery
Dans l'ensemble des 16 cibles, je n'ai que 3 modèles de protéines. Ce sont des protéines très proches des autres cibles pour lesquelles les structures sont disponibles (co-cristallisées avec leur substrat). Ces modèles ont été validés par superposition de structure qui montrent que les domaines de binding sont conservés (intra-genre viral) ainsi que la conformation des chaines latérales.
Merci pour l'idée de comparer les résultats entre les différents logiciels. Dans la stratégie initiale, je souhaite comparer les résultats obtenus entre DockingApp et DockingApp RF qui ne reposent pas sur les mêmes algo. Je vais tester MTiOpenScreen pour voir si je peux également ajouter ces résultats à l'étude.

La première application est prête.

Je crois que le logiciel mobaxterm ( https://mobaxterm.mobatek.net/ ) devrait vous permettre de vous connecter au serveur depuis windows et normalment par default il "forward" le X (il déporte l'affichage sur votre bureau)

ensuite en ligne de commande vous pouvez taper:

sinteractive --cpus=32
cd /shared/projects/docking_covid19/DockingApp/
./DockingApp.sh

Et si tout va bien alors ca devrait ouvrir l'application sur votre ordinateur avec l'execution deporté sur le cluster.

Si vous voulez bien tester et nous faire un retour de ce qui va ou pas, merci d'avance.

Et aussi un gros merci à @julien qui a fait tout le boulot :wink:

@Francois @julien
Un grand merci déjà pour toute votre aide ! J'ai bien téléchargé et installé Mobaxterm mais je ne trouve pas comment me connecter au serveur afin de pouvoir taper la ligne de code et tester l'application. Merci d'avance pour vos explications.

A priori je dirais qu'il faut ouvrir une session, comme indiqué ici:

Choisir "SSH" comme type de connection
Et utiliser votre login et l'adresse: core.cluster.france-bioinformatique.fr

Le but étant d'avoir un terminal sur le serveur ou taper les commandes que j'ai indiqué:

(Si vous voulez bien ré-essayer pendant que j'essaye de trouver quelqu'un qui a un ordinateur sous windows :wink: )

Voici quelques instructions plus détaillées :

  • Après avoir lancé MobaXterm, cliquez sur Session
  • Choisissez ensuite SSH
  • Dans le champs "Remote host" indiquez core.cluster.france-bioinformatique.fr
  • Cochez la case "Specify a username" et indiquez votre nom d'utilisateur du cluster
  • Cliquez sur "OK"
  • Le logiciel va vous demander votre mot de passe du cluster, tapez le (aucun caracètre ne s'affiche pas sécurité) puis appuyez sur "Entrée"

Vous êtes à présent connecté sur le cluster.

Vous pouvez à présent démarrez votre session de travail :

  • Tapez sinteractive --cpus=32 pour démarrer un session interactive sur le cluster et disposer de 32 coeurs
  • Votre mot de passe vous sera à nouveau demandé
  • Tapez la commande cd /shared/projects/docking_covid19/DockingApp/ pour vous déplacer dans le dossier d'installation de DockingApp pour votre projet
  • Tapez la commande ./DockingApp.sh pour lancer le logiciel

Julien

@julien @Francois
Tout fonctionne très bien. J'ai juste une dernière question pour être parfaitement au point et commencer le travail. Comment puis-je importer les différents fichiers que j'ai transféré (les deux banques de molécules et les cibles) vers les dossiers "resource" (cibles) et "input" (library) ? En tout cas merci beaucoup pour votre réactivité et l'accompagnement !

Super !
Etes-vous sûr qu'il est nécessaire de copier vos banques dans les dossiers "resource" et "input" ?
Il me semble que vous pouvez spécifier dans le logiciel un dossiers pour "Input target files" et "Input ligend".
Sinon, je vous recommande de copier les fichiers au bon endroit en utilisant simplement Filezilla comme vous l'avez fait aujourd'hui pour copier vos données sur le cluster.

Quelques questions supplémentaires :

  • Avez-vous une idée de la durée d'un run avec le logiciel ? Est-ce qu'il s'agit de quelques heures ? quelques jours ?
  • Savez-vous si en augmentant significativement le nombre de coeur alloué au logiciel vous pourrez obtenir des meilleurs performances ? (nous pouvons vous orienter vers un noeud de calcul disposant de 124 coeurs)
  • Avez-vous une idée de la RAM nécessaire au bon fonctionnement de vos traitements ? Par défaut vous ne disposez que de 2Go de RAM mais vous pouvez en réserver jusqu'à 3To sur notre plus gros noeud.

@julien
Je n'ai aucune idée du temps que ça va prendre. Je vais finir d'organiser l'étude pour faire les choses dans l'ordre. Je peux lancer un premier crible sur la banque la plus grande pour avoir une idée du temps d'un run. Je vous tiens au courant.

Par contre ce matin j'ai un problème avec MobalXterm. Lorsque j'ouvre ma session pour pouvoir taper les lignes de commande, je ne peux rien écrire... J'ai essayé de tout relancer depuis le début mais pas plus de succès.

Nous avons une panne temporaire. Le cluster sera à nouveau disponible dans quelques instants.

1 « J'aime »

@julien
Je viens de lancer un premier screen. L'analyse d'une molécule sur un binding site défini prend environ 10 sec. Si on multiplie 10 sec par 6500 molécules pour 15 protéines, ça va faire long... Je peux essayer de réduire le nombre de cibles à tester de mon côté.

Bonjour,

Ce serait possible de lancer un traitement qui devrait prendre une heure d’après vos estimations ?
Et bien sur nous prévenir quand il est lancé, ceci afin de nous permettre d'analyser les ressources utilisé et donc analyser comment on pourrait améliorer les choses.

Et deuxième point, est-ce que vous êtes disponible pour faire une viso conf,vers 14h par exemple,ou au pire à 17h ? Essentiellement pour nous expliquer comment vous utiliser ce logiciel et donc nous permettre de faire des tests de performance plus pertinent de notre coté.

@Francois
Bonjour, j'ai lancé une analyse sur les 6000 composés (à 16% d'avancement). Vous pourrez voir le programme tourner de cette manière. Faites moi savoir si je dois lancer une autre étude sur 100 composés pour avoir les résultats dans l'heure. Par contre, je donne une conférence à 14h donc je serai disponible plutôt aux alentours de 17h si c'est possible pour vous. Merci !

Merci, du coup ca à l'air de bien utiliser les 32 coeur CPU alloué, on peux monter jusqu'a 54 en restant sur les serveurs "normaux", a priori ca devrait être plus rapide.

Je vais faire la modif pour autoriser plus de coeur, il faudra changer l'option de sinteractive

Si vraiment c'est encore trop lent on pourra passer sur bigmen qui a 128 CPU.

(Pour la visio je vois avec les autres et je confirme ou pas 17h)

Du coup pour le prochain traitement vous pouvez utiliser:

sinteractive --cpus=54

Et nous dire si ça améliore la vitesse ou pas

@Francois
Super pour les 54 CPU. Je pense que ça suffira pour la suite. Ca me laissera le temps de traiter les résultats au fur et à mesure. Ca risque malgré tout de prendre 15 jours. Tenez moi au courant de ce que vous préférez suivant les demandes que vous préférez (allouer plus de puissance et aller plus vite ou prendre le temps).

Nous on préfère rien du tout. On essaye de faire en sorte que chacun puisse faire ses calculs sans trop pénaliser les autres, mais pour le covid19, on peux sans souci accorder plus de ressource que d'habitude.
Donc j'ai envie de dire, que c'est plutôt a vous de nous dire si avec 54 cœur c'est suffisant ou pas :wink:

Concernant le visio conf, en faite ça va être compliquer pour 17h ce soir, du coup peut-être en début de semaine prochaine si c'est encore pertinent a ce moment la.

1 « J'aime »

@Francois @julien

Bonjour l'équipe,
J'espère que vous allez bien. Je vous fais un retour suite à ce week-end. J'ai voulu avancé et j'ai lancé quelques runs. J'ai eu quelques problèmes.

  • le premier est que certains runs ne vont pas jusqu'au bout (98 molécules testées sur 100) ;
  • le second est que l'application semble fermer la session si je ne traite pas les résultats 15 minutes après la fin du run (ce qui me fait perdre les données) ;
  • depuis hier soir, je n'arrive pas à me connecter au serveur : après avoir tapé la commande sinteractiv --cpus=54, la session charge dans le vide mais rien ne se passe;
  • le dernier point concerne les logiciels DockingApp et DockingAppRF. Je ne peux pas copier/coller la colonne de résultats qui m'intéresse, je suis obligé de faire case par case. Pour 100 molécules, ça va mais quand je vais passer sur la banque de 6500 composés, j'ai moins apprécié. J'ai vu avec le développeur de l'application qui m'a confirmé qu'il n'y a pas cette fonctionnalité nulle part. Deux options possibles : soit il peut le faire et m'envoyer le nouveau dossier mais cela implique qu'il faille redéployer le logiciel, soit de votre côté vous pouvez rajouter cette fonction sur le logiciel ?

Sinon les runs se passent bien pour des banques relativement petites mais si je peux passer sur une capacité de calcul plus grande pour la banque ASINEX (6500 composés), je suis plus que preneur.

Je suis disponible pour échanger avec vous cet après-midi, demain après-midi, ou mercredi dans la journée.

Bonne semaine à tous et merci d'avance pour vos retours.

Baptiste

Bonjour,

On a eu quelques souci sur le cluster, voir Accès Cluster Down?

On pourra probablement pas modifié l'application nous même sans les sources, le mieux c'est que le développeur fasse la modification et qu'on mette a jour l'application sur le cluster.

Et ok pour la capacité de calcul plus importante, on va vous donner accès a bigmem

@bmartin, tu peux peut-être tenter ça, si ça n'est pas déjà le cas :

  • My SSH connection freezes or drops out after N seconds of inactivity.

This is usually the result of a packet filter or NAT device timing out your TCP connection due to inactivity. You can check the "Enable SSH keepalive" box under "Settings" --> "Configuration" --> "SSH" tab.
Enabling this option will ensure that the connection is kept "fresh" in the device's connection table.