Problème avec le slurm controller

Bonjour à tous,

J'ai un problème avec le slurm controller, quand j'essaye d'utiliser srun ou squeue, j'ai le même message :
slurm_load_jobs error: Unable to contact slurm controller (connect failure)

Merci d'avance

Bastien

Je sais pas si cela peut aider:

$ systemctl status slurmd -l
● slurmd.service - Slurm node daemon
Loaded: loaded (/usr/lib/systemd/system/slurmd.service; disabled; vendor preset: disabled)
Active: inactive (dead)

Pareil ici...

sbatch: error: Batch job submission failed: Unable to contact slurm controller (connect failure)

Slurm STP revient!!!

Merci de votre aide!

Bonjour,

Désolé pour le couac (une erreur lors d'une modification de l'infrastructure).
Mais Slurm vous a entendu et est revenu (merci @julien pour la correction)

Bonne soirée

1 « J'aime »

Aucun problème. Merci beaucoup