Bonjour,
J'ai un problème systématique avec ma session RStudio,
j'ai vérifié que je ne dépasse pas le quota, ni en taille ni en nombre de fichier, ma session s'initie correctement,
je peux lancer mon code, mais après environ une heure je suis déloggé avec le message intitulé RStudio Initialization Error: "Status code 504 returned by RStudio Server when executing 'client_init' ".
Alternativement j'ai parfois le message de RStudio " R is taking longer to start than usual", reload ne change rien, et je peux faire une session en safe mode mais dans ce cas je perd les calculs en cours. Idem si je nettoie les fichiers de la session.
Y a t il quelque chose que je peux faire pour remédier à ce problème, ou une stratégie alternative?
Merci de votre aide!
Avez-vous tester cette solution ?
https://ifb-elixirfr.gitlab.io/cluster/doc/troubleshooting/#rstudio-timeout-or-do-not-start
Oui bien sur! Il m'est juste indiqué après "rm .RData" que le fichier n'existe pas.
J'ai aussi essayé rm -rf ~/.config/rstudio mais rien n'y fait.
Peut être est-ce un problème de dossier de travail? Car je n'arrive pas à indiquer à Rstudio de travailler sur le dossier de mon projet et je suis donc dans le dossier home. Même si celui ci n'est pas saturé, peut-être cela peut-il poser problème?
En tout cas j'ai essayé différents paramètres pour créer la session mais obtiens la même erreur systématiquement.
Bonjour @JC333
Pas de réponse, mais quelques remarques:
- Vous demandez ~250Go de mémoire mais n'utiliser qu'un dizaine de Go
ll est important de toujours vérifier les ressources utilisées, en utilsant par exemplereportseff
: https://ifb-elixirfr.gitlab.io/cluster/doc/slurm/slurm_efficiency/#post-mortem-analysis - Si votre calcul est très important, il conviendrait alors de basculer vers sbatch/Rscript (https://ifb-elixirfr.gitlab.io/cluster/doc/software/r/#migrate-from-rstudio-2-rrscript) plutôt que sur un usage interactif via RStudio.
- Je ne vois pas d'erreur dans les logs
- Votre session est bien lancé pour durer 12h. Si cela bug avant, c'est probablement dû à un crash de RStudio. Est-ce que ce ne serait pas lié à un calcul en cours (bug ou autre) ?
Bonjour,
Merci pour votre réponse, j'ai migré vers Rscript comme recommandé et le calcul a effectivement l'air de se faire pendant plus longtemps, mais je finis quand même par avoir une erreur,
soit de déconnexion: "Your connection to the remote server has been terminated." ,
soit celle ci après quelques heures:
Run Rphenograph starts:
-Input data of 1558096 rows and 37 columns
-k is set to 70
Message from syslogd@clust-slurm-client at Sep 16 13:10:49 ...
kernel:[4234840.389019] LustreError: 1617182:0:(mdc_dev.c:1413:mdc_object_ast_clear()) ASSERTION( oinfo->loi_lvb.lvb_size >= oinfo->loi_kms ) failed:
Message from syslogd@clust-slurm-client at Sep 16 13:10:49 ...
kernel:[4234840.514119] LustreError: 1617182:0:(mdc_dev.c:1413:mdc_object_ast_clear()) LBUG
Message from syslogd@clust-slurm-client at Sep 16 13:10:49 ...
kernel:[4234840.639520] Kernel panic - not syncing: LBUG
Est ce que cela peux vous aider à cerner le problème?
En particulier dois-je faire quelque chose pour éviter la déconnexion au serveur à partir du Core Cluster Shell?
Merci!
Il ne faut lancer aucun calcul sur les noeuds de login.
Pour lancer des traitements (tel que des RScript), il faut soumettre votre job via sbatch (SLURM user guide - IFB Core Cluster Documentation).
Votre job est alors indépendant de votre connexion.
N'hésitez pas à prendre un peu de temps à prendre en main l'usage d'un cluster de calcul (ca vous fera gagner du temps, les mécanismes sont les mêmes sur tous les centres de calcul, et cela permettra d'utiliser au mieux les ressources).