Bonjour,
J'aimerais comprendre le fonctionnement de la queue pour l'utilisation des gpu de l'IFB. J'utilise alternativement les commandes 'sinfo -N -O nodelist,partition:15,Gres:30,GresUsed:50 -p gpu'
et 'squeue -p gpu' pour voir l'utilisation courante des gpu et la queue pour lancer des jobs, cependant je ne comprends pas tout... Il y a des fois ou il n'y a rien d'autre dans la queue et le gpu que je demande est libre, pourtant le job ne se lance pas.
Y a-t-il une restriction sur leur utilisation si j'ai déjà d'autres jobs qui tournent en gpu ? (j'ai pourtant déjà réussi à lancer des jobs gpu en simultané). Si j'ai bien compris, il ne faut pas demander plus de cores cpu que disponibles sur un même noeud gpu (j'ai déjà réussi à lancer deux jobs gpu en simultané sur les deux gpu 40g du noeud 3 en calculant le nombre de cores restant pour lancer mon deuxième job, sinon cela ne fonctionnait pas...), ai-je bien compris ? Y a-t-il un moyen de consulter le nombre de cores actuellement utilisé sur chaque noeud gpu ?
Globalement, comment fonctionne l'attribution des gpu ? Toute aide est la bienvenue !
Merci beaucoup d'avance pour votre temps,
Bonne journée,
Mathieu