Problème d'I/O sur /tmp

Bonjour,

depuis quelque temps le volume /tmp n'est plus accessible, ce qui cause pas mal d'erreur pour différents programmes qui écrivent sur /tmp
Quand on fait ls sur la racine, on voit qu'il y a un problème :

$ ls -ltr /
ls: impossible d'accéder à /tmp: Erreur d'entrée/sortie
total 20
d??????????   ? ?    ?       ?            ? tmp
drwxr-xr-x.   2 root root    6 Apr 11  2018 srv
drwxr-xr-x.   2 root root    6 Apr 11  2018 mnt
drwxr-xr-x.   2 root root    6 Apr 11  2018 media
drwxr-xr-x.   2 root root    6 Apr 11  2018 home
lrwxrwxrwx.   1 root root    7 Nov  6  2018 bin -> usr/bin
lrwxrwxrwx.   1 root root    9 Nov  6  2018 lib64 -> usr/lib64
lrwxrwxrwx.   1 root root    7 Nov  6  2018 lib -> usr/lib
lrwxrwxrwx.   1 root root    8 Nov  6  2018 sbin -> usr/sbin
drwxr-xr-x.   3 root root   16 Mar 20  2019 opt
drwxr-xr-x.  14 root root  166 Mar 26  2019 usr
drwxr-xr-x    3 root root   26 Mar 26  2019 gpfs
drwxr-xr-x.  20 root root  286 May  2  2019 var
drwxr-xr-x    3 root root  119 Oct  6 16:34 shared
dr-xr-xr-x.   5 root root 4096 Feb  7 08:28 boot
dr-xr-x---.   9 root root 4096 Feb 23 11:44 root
dr-xr-xr-x  717 root root    0 Mar  7 09:06 proc
drwxr-xr-x. 105 root root 8192 Mar  7 09:09 etc
drwxr-xr-x    2 root root    0 Mar  7 09:09 misc
drwxr-xr-x    2 root root    0 Mar  7 09:09 net
drwxr-xr-x    2 root root    0 Mar  7 09:09 cvmfs
drwxr-xr-x   34 root root 1200 Mar  7 09:09 run
drwxr-xr-x   20 root root 3500 Mar  8 01:11 dev
dr-xr-xr-x   13 root root    0 Mar  9 11:54 sys

Et par exemple, si on fait tourner mafft

$ mafft toto.fst > toto.mafft
mktemp: failed to create directory via template '/tmp/mafft.XXXXXXXXXX': Input/output error
mktemp seems to be obsolete. Re-trying without -t
mkdir: cannot create directory '/tmp': Input/output error
mktemp: failed to create directory via template '/tmp/tmp/mafft.XXXXXXXXXX': Input/output error
...

Ça m'était déjà arrivé il y a quelques jours, et c'était revenu à la normale après un moment.

Est-il possible d'y remédier ?

Merci
Jean

En fait ça me fait l'erreur sur le cpu-node-39, pas sur le noeud principal ni sur un autre (j'ai pas essayé tout le monde), donc ce n'est plus bloquant, mais du coup le noeud cpu-node-39 n'est pas très utilisable.

Bonjour,

En effet. Merci pour l'alerte.
Le nœud a été "drain". On va regarder.

Bonne journée

Bonjour,

Pour info, le nœud en question est de retour (après un xfs_repair de /tmp).

Merci et bonne journée