Quelle commande slurm pour connaitre la ressource encore dispo sur un noeud?

Bonjour

j'essaie de trouver une commande qui permette de connaitre la resource encore disponible sur un noeud particulier afin de faire passer mon propre job avec la reservation optimale.

Pour être plus clair: je voudrais faire passer un job sur BIGMEM mais je m'aperçois qu'un collègue fait déjà tourner qqch sur ce meme noeud. Il faudrait que je puisse déterminer le nombre de CPU et de RAM encore non réservés pour pouvoir ajuster ma propre réservation en fonction, de sorte que mon job puisse se lancer immédiatement.

Si qq'un à la recette je suis preneur
Merci
Guillaume

Mémoire

Il est facile de connaître la memoire disponible:

sinfo -Nel --format "%.8N %.9R %.8T %.4c %.8O %.7z %.8e %.7m %.6w %E"

(Oui, c'est long donc, je conseille un alias :stuck_out_tongue: )

CPU

Pour le CPU, je ne sais pas, c'est moins évident ...

$ squeue -p bigmem
             JOBID PARTITION     NAME     USER ST       TIME  CPUS MIN_MEMO  NODES NODELIST(REASON)
          13873324    bigmem Ensamble   cnorris  R   15:46:43    52       1T      1 cpu-node-69
$ sacct --format=JobID,JobName,User%15,Partition,ReqCPUS,ReqMem,State,Start,End,CPUTime,MaxVMSize -j 13873324
       JobID    JobName            User  Partition  ReqCPUS     ReqMem      State               Start                 End    CPUTime  MaxVMSize
------------ ---------- --------------- ---------- -------- ---------- ---------- ------------------- ------------------- ---------- ----------
13873324     Ensamble_M         cnorris     bigmem       52        1Tn    RUNNING 2020-11-27T01:05:19             Unknown 34-05:33:24

(Là encore, je conseille un alias)

TIPS:

Mes alias au cas où:

alias sinfoNel='sinfo -Nel --format "%.8N %.9R %.8T %.4c %.8O %.7z %.8e %.7m %.6w %E"'
alias sacctReq='sacct --format=JobID,JobName,User%15,Partition,ReqCPUS,ReqMem,State,Start,End,CPUTime,MaxVMSize'

Si quelqu'un d'autre à un avis ?

Merci Gildas, je devrais pouvoir bien me débrouiller avec ces commandes

Voici une commande qui pourrait t'intéresser :
scontrol show node nom_du_node | grep "TRES"