Jobs PENDING depuis plusieurs jours

,

Bonjour,

Ca fait quelques jours que j'essaye de lancer des jobs, mais ils restent toujours en "PENDING".
Comment cela se fait-il?

Merci d'avance pour votre aide,

Laura

Voici le début de mon script bash (qui me sert à lancer mon script R):

#!/bin/bash

#SBATCH -o log_%A_%a.err.out
#SBATCH -e log_%A_%a.err.out
#SBATCH --partition=long
#SBATCH --mem=180G
#SBATCH --nodes=1
#SBATCH --cpus-per-task=1 or #SBATCH --cpus-per-task=16
#SBATCH --mail-type=ALL

Bonjour,
Idem tout mes job en "long" reste en pending depuis 2 jours.... 1CPU et 4G de ram...
Alors qu'un srun sur "short" passe !!!

Bonjour,

Notre hébergeur doit réaliser une maintenance électrique le lundi 5 février 2024 comme indiqué via le bandeau: :warning: :warning: Arrêt électrique de l'IDRIS le Lundi 5 février 2024 :warning: :warning:

Ce qui nous contraint a arrêter toute l'infrastructure le vendredi 2 février.
En conséquence, les jobs longs qui devrait seront toujours running à cette date sont bloqués (PENDING, pour ne se lancer qu'après cet arrêt).
C'est ce que signifie (ReqNodeNotAvail, Reserved for maintenance) dans la colonne NODELIST(REASON) de squeue.

Par défaut, sur la partition long, les jobs ont par défaut un temps d’exécution de 30j.
Ce qui est le cas pour vos jobs.
Si les jobs doivent vraiment durer 30j alors il semble normal de les faire attendre pour les lancer après la coupure.
Sinon, je vous invite à préciser la durée d’exécution prévue via l'option --time (ce qui me semble être une bonne pratique dans tous les cas).
Si votre job peut s'exécuter avant la coupure (i.e. une dizaine de jours), alors ils seront lancés.

Désolé pour ces désagréments.

1 « J'aime »