Bonjour,
je lance d'habitude un script R en ssh depuis mobaxterm et tout se passe bien.
Depuis hier, ma commande sbatch fonctionne mais le job s'arrête après quelques minutes sans aucune explication, avez-vous une idée ? rien a changé dans le script par ailleurs !
Dernier job en question : 40496259.
Merci !
Alexis
Bonjour,
Votre script ne renvoie pas d'erreur et semble se terminer correctement.
Pouvez-vous nous indiquer le chemin vers votre script sbatch et la commande exécutée pour qu'on puisse regarder plus en détail ?
Attention vous demandez beaucoup de ressources (CPU/RAM/Time).
Merci de vérifier et veiller au bon usage des ressources alloués: https://ifb-elixirfr.gitlab.io/cluster/doc/troubleshooting/#slurm-how-to-use-resources-wisely
Avant de demander autant et à moins d'être sûr, il est sans doute préférable de demander moins et d'augmenter si nécessaire.
Oui merci pour votre réponse, tout roule désormais, mystère !
Je vais essayer de réduire la voilure je comprends.
Merci encore,
Alexis
Bonjour Alexis,
Pour info, votre job lance 99 processus R
qui lance chacun 128 threads.
├─R
│ └─128*[{R}]
├─R
│ └─128*[{R}]
├─R
│ └─128*[{R}]
├─R
│ └─128*[{R}]
[...]
C'est peut-être contre-productif et vous invite à vérifier qu'il n'y a pas de coquille
Oui oui pb d'inattention de mon côté, j'ai réduit la voilure en termes de ressources demandées.
Merci ++++