Rallonge du time OUT

Bonjour

Vous serait il possible de rallonger le time out d'un job (2313556) en cours pour lequel j'ai sous estimé le temps ?

scontrol update jobid=2313556 TimeLimit= 15-00:00:00

Merci

Cédric

Bonjour Cédric,

Le cluster n'étant pas plein et les ressources suffisamment disponibles, nous avons prolongé le timeout du job comme demandé (15j).

Bonne journée

Bonjour à tous,

J'écris via ce sujet car j'ai une requête similaire.

J'ai très mal estimé le temps d'exécution d'un job je pensais qu'il serait fait en 12h mais maintenant ça fait 15h ... et je l'ai lancé sur la partition fast. J'ai donc révisé le cours de @gildaslecorguille et @julien de ebai 2019 sur le cluster IFB-core et je vois que la limite de temps est de 24h pour cette partition.

J'ai fait un test avec des donnée 10x plus petite sur un autre serveur et on est autour de 8h. Je me suis bien planté sur ma première estimation.

Es-ce qu'il serait possible exceptionnellement d'allonger le temps pour ce job?
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
4855675 fast R lkhamvon R 15:28:15 1 cpu-node-6

Dans tout les cas merci,

A+ dans le :bus:

Désolé @lkhamvongsa mais j'ai réagit trop tard.

Mais d'une manière générale, nous avons décidé qu'à l'avenir, nous n'allons plus rattraper les jobs en fast. Les délais sont trop courts (généralement, nous n'avons qu'une poignée d'heure pour réagir) et c'est cela reviendrait à faire trop de micro-gestions.

Comme on dit, c'est le jeu ma pov' Lucie :stuck_out_tongue:

Nous pourrons éventuellement faire des exceptions sur les jobs long qui serait sur le point de ce terminé.

Bonjour,

Ok je prends note et serais plus prudente à partir de maintenant.

Et dans tout les cas vous êtes au top !

Merci,

A plus dans le :bus:

Bonjour,

J'ai également le même souci que Mme Khamvongsa.
Certains de mes jobs sont assez long (deep learning), les calculs peuvent prendre une semaine voire plus.

Est-il possible d'ajuster le time out ? Si oui, comment ?
L'option -t unlimited avec slurm-drmaa renvoie une erreur code 13: invalid date/time format.

En vous remerciant,

Bien cordialement,

Julie