Bonjour,
J'ai récemment essayé de lancer un script utilisant toute la mémoire et les coeurs alloués à un utilisateur, en spécifiant les options suivantes :
#SBATCH -n 300
#SBATCH --mem 1500GB
J'ai ensuite vérifié qu'aucun autre job ne tournait, avant de lancer mon script. Cependant, j'ai reçu l'erreur suivante :
sbatch: error: Batch job submission failed: Requested node configuration is not available
Pourriez vous m'indiquer ce que cela signifie, s'il vous plait? Est-ce qu'il n'est pas possible de mobiliser toutes mes ressources sur un seul script?
Merci beaucoup par avance,
Samuel
Bonjour,
Il n'y a pas de serveur équipé de 300 cœurs pouvant répondre au nombre de tâche spécifiés (#SBATCH -n 300
), d'où le Requested node configuration is not available
.
Voir notamment les caractéristiques des serveurs: Cluster description - IFB Core Cluster Documentation
A noter que vous ne spécifier par le nombre de CPU/cœurs que vous voulez sur un noeud de calcul mais le nombre de tâche total (même si une tâche = 1 CPU). On pourrait donc avec "300" tâches mais répartis sur plusieurs serveurs (par exemple 200 CPU/tâche sur un serveur et 100 CPU/tâche sur un autre). 1. Je ne suis pas certains que ce soit le fonctionnement voulu (rares sont les logiciels/outils/scripts qui peuvent gérer ça) 2. Vous demandez également 1500G en RAM et par noeud de calcul. Si les tâches sont répartis sur 2 serveurs, on aura une demande d'allocation de 2*1500G (3000G) ce qui va au delà des limites (SLURM at {{ platform.name }} - IFB Core Cluster Documentation).
Dans tous les cas, avant d'utiliser de telles ressources, il convient de tester sur un petit jeu de données et moins de ressources.
Bonjour,
Merci pour ces précisions, je vais raffiner ma demande en fonction du matériel disponible. Je n'ai d'ailleurs pas précisé que je ne demandais qu'un seul nœud (#SBATCH -N 1
), ce qui ne devrait donc pas poser de problème de duplication de mémoire (j'espère!).
J'ai déjà fait des tests préliminaires et le programme marche sur de très petits jeux de données. J'ai bien conscience de demander ensuite beaucoup de ressources, mais la tâche que j'essaie d'accomplir (détection de sélection via le programme emsel) prend énormément de temps et je n'ai pas réussi à analyser un chromosome seul en moins d'un mois... Je voudrais donc voir s'il est possible de réduire ce temps en mobilisant plus de mémoire.
Merci pour votre aide!
1 « J'aime »