Page "status" pour le cluster

Hello

Suite aux récents problèmes rencontrés sur le cluster et la frustration rencontrée par certains utilisateurs pour savoir si le problème venait de chez eux ou du cluster, serait-il possible d'avoir une page de status ?

Par exemple status.cluster.france-bioinformatique.fr ou status.france-bioinformatique.fr, qui indiquerait l'état de santé du cluster (et aussi de rstudio).

Par extension, on pourrait même imaginer avoir le % d'utilisation du cluster, le nombre de jobs par status (running, waiting...).

J'imagine que dans cette demande, ce n'est pas dans tant l'interface web qui posera problème que le nombre et la qualité des sondes et métriques mises en place :wink:

++

Pierre

Bonjour Pierre,

En effet, l'idée (status et métrique) a déjà été évoqué.
Pour l'instant, nous avons notre serveur de supervision (nagios) mais il n'est pas public et tout n'est pas encore couvert (typiquement le blocage spécifique que l'on rencontre en ce moment).
Il reste encore du travaille pour implémenter tout ça...

En tout cas, une page type "status" me semble aussi pertinente.

Bon après-midi

1 « J'aime »