Mémoire / cpus blast

etoulza · Février 26, 2019, 8:51

Bonjour,

Je suis en train de faire des tests pour tester les scripts que j’utiliserai en TP la semaine prochaine (merci encore à l’équipe pour les comptes étudiants temporaires !) et me familiariser avec le système. Mes jobs ont été interrompus assez rapidement pour un problème de mémoire :

[etoulza@clust-slurm-client ~]$ more slurm-36268.out
slurmstepd: error: Job 36268 exceeded memory limit (24822000 > 24576000), being killed
slurmstepd: error: *** JOB 36268 ON cpu-node-6 CANCELLED AT 2019-02-26T15:44:28 ***
slurmstepd: error: Exceeded job memory limit

Voici mon script :

#!/bin/bash
#SBATCH --partition long
#SBATCH --cpus-per-task 12

module load blast
blastx -query ~/test.fasta -db /shared/bank/nr/current/blast/nr -out ~/test-25-nr.blastx.tab -outfmt 6 -e
value 0.001 -num_threads 12 -max_target_seqs 25

J’ai donc deux petites questions :

combien est-ce que je peux utiliser de cpus avec mes étudiants (vu que j’aurai 12 à 15 jobs en simultané selon les groupes pour un blastx de ~4000 séquences contre NR) ?
combien de mémoire je dois attribuer (–mem) pour être tranquille ?

Merci d’avance !

Bien cordialement

eve

gildaslecorguille · Février 26, 2019, 9:18

[etoulza@clust-slurm-client ~]$ more slurm-36268.out
slurmstepd: error: Job 36268 exceeded memory limit (24822000 > 24576000), being killed
slurmstepd: error: *** JOB 36268 ON cpu-node-6 CANCELLED AT 2019-02-26T15:44:28 ***
slurmstepd: error: Exceeded job memory limit

C'est la grande question. C'est à évaluer par itération. Si on demandes "beaucoup trop", on peut potentiellement tu vas attendre plus longtemps pour obtenir les ressources (des admins regardant pourraient te le signaler). Et en effet, si pas assez, kill.

Mais blast n'est pas réputé pour consommé beaucoup de mémoire. Tente pour commencer :

#SBATCH --MEM=10GB

http://taskforce-nncr.gitlab.cluster.france-bioinformatique.fr/doc/slurm_user_guide/#-memltsizeunitsgt

`--MEM=<SIZE[UNITS]>`

Specify the real memory required per node. The default units is MB (Default: 2GB)
The job is kill if it exceed the limit

Il est communément admis qu'il y a un plateau au niveau de la performance de blast au delà de 4 CPU. (Un site au pif : How to correctly speed up blast using num_threads)

Donc je dirais 4 et ça minimise le temps d'attente des jobs.

L'idéal avec Blast est de découper le fichier d'entrée et de soumettre autant de blast que de fichier d'entrée et de les soumettre via des job array mais c'est compliqué dans le cadre d'une formation.

Vous confirmez :

@r1corre - spécialiste du Blast
@julien - spécialiste de Slurm

r1corre · Février 27, 2019, 6:22

Bonjour

JE confirme qu’il n’est pas nécessaire d’attribuer plus que 4 à 6 CPU par traitement et qu’il vaut mieux découper le fichier d’entrée.
En ce qui concerne la mémoire la mémoire je suis moins sur de moi . Je dirais que c’est peut être dépendant également de la taille de la banque de ref. (https://www.ncbi.nlm.nih.gov/books/NBK279695/#)
il y a manifestement qq parametres sur lesquels il est possible de jouer mais je n’ai pas d’experience sur le sujet .
dsl

dbenaben · Février 27, 2019, 8:21

Salut,

Pour la mémoire, j’ai tendance à privilégier l’option --mem-per-cpu qui va permettre de faire varier la taille de la mémoire en fonction du nombre de CPU mais les deux sont bien évidemment valables.

Pour la quantité à réserver, pour moi, il faut tester. Quitte à demander une première fois trop de ressources, analyser ensuite les ressources utilisés et être plus restrictif sur les futurs jobs. La commande sacct peut alors être utile.

# sacct - displays accounting data for all jobs
sacct -l -j <jobid>
# ou en spécifiant les champs
sacct --format="JobName,NTasks,CPUTime,MaxRSS" -j <jobid>

a+

gildaslecorguille · Mars 8, 2019, 3:24

@etoulza As-tu résolu ton problème sur la base de nos réponses ?

etoulza · Mars 8, 2019, 5:26

Bonjour,
Je suis passée à 4 coeurs avec 20Gb de mémoire chaque pour que ça passe lors de mes tests (impossible en effet de découper les fichiers vu l’organisation des TP et le niveau débutant des étudiants). On va voir la semaine prochaine avec les étudiants si ça ne coince pas trop en termes de délai, je vous ferai un retour sur ce point.
Merci et bon week-end !
eve

ppericard · Septembre 6, 2019, 2:20

@r1corre, @gildaslecorguille, est-ce que par hasard vous avez des examples de scripts SLURM pour lancer un BLAST en splittant les fichiers (type job-array) sur le cluster IFB ? un peu comme atomic_blast dans le temps
Sur une machine unique, j'utilise maintenant GNU parallel pour splitter les jobs BLAST, mais ça correspondrait à un job unique sur le cluster et j'ai des jobs qui vont dépasser le temps limite.
Merci d'avance
Pierre

julien · Novembre 2, 2019, 9:01

Il y a un exemple de script utilisant un job array ici https://community.cluster.france-bioinformatique.fr/t/rscript-via-srun/268/11?u=julien

Est-ce que ça peut aider pour répondre à ta question ?