Out of memory oom-kill

Bonjours,

J'ai l'erreur suivant sur mon projet aisegmenation :

slurmstepd: error: Detected 1 oom-kill event(s) in StepId=37589703.0 cgroup. Some of your processes may have been killed by the cgroup out-of-memory handler.
srun: error: cpu-node-88: task 0: Out Of Memory

J'ai ensuite modifié mon fichier .sh avec :

#SBATCH --mem 250GB
#SBATCH --account=aisegmentation
#SBATCH --partition=bigmem

Comme j'ai peu le voir sur un message de la communauté.

Est-il possible maintenant d'avoir accès à la partition bigmem pour le projet aisegmentation ?

Merci pour votre aide

Julie

Bonjour @Zulie,

La partition bigmem a moins de sens désormais après l'acquisition de 16 nodes à 2TB accessible via les partitions fast ou long.

https://ifb-elixirfr.gitlab.io/cluster/doc/cluster-desc/

:point_up: Pensez à ajuster petit à petit vos besoins en ressource en étudiant la consommation réelle de vos outils après le fin des premiers jobs : SLURM user guide - IFB Core Cluster Documentation

Bonne continuation