Job de plus de 10 jours

Je dois lancer des calculs. Je peux lancer en 1 seul job (plus d'un mois de calculs), ou alors découper les calculs (en ~15.000 jobs), la majorité seront très rapides (qq mn à 1-3 jours), quelques rares plus longs (> 10 jours), ou limiter le nombre de jobs (mais en augmentant le temps d’exécution de chaque job).
Je n'ai trouvé nulle part la description des priorités, combien de jobs on peut lancer en parallèle, la politique de file d'attente, donc suis embêtée pour savoir quelles stratégie adopter.
Par contre je vois que sur le cluster les plus longs jobs ne peuvent durer plus de 10 jours (et ca sera limitant dans mon cas, peu importe la stratégie adoptée).

Est-ce que la durée des jobs peuvent être modifiées ?
est-ce que le cluster peut gérer autant de calculs sans impacter les autres?

à voir avec vous ce qu'il y a de mieux à faire

Christelle

Bonjour;
Vous pouvez consulter la configuration des partitions SLURM (et les limitations éventuelles) avec la commande suivante :
$ scontrol show partition/node/config

Par contre je ne suis pas habilité à répondre si la durée des jobs peut être augmenté à +10jours

Bonjour Christelle,

En attendant d'avoir une gestion plus fine des partitions et des priorités, nous avons augmenté la durée maximale des jobs sur la partition long à 30 jours.

J'espère que cela s'avérera suffisant, dans le cas contraire n'hésitez pas à nous le dire.

Bon week-end.