Erreur avec l'aligneur STAR sur Galaxy

a-velt · Janvier 29, 2021, 2:31

Bonjour,

Je rencontres (ainsi que deux autres collègues) une erreur avec l'outil STAR (alignement RNAseq). Cette erreur n'apparait pas à chaque fois, mais uniquement pour certains échantillons (qui proviennent de la même expérience RNAseq).

Voici l'erreur :

!!!!! WARNING: --genomeSAindexNbases 14 is too large for the genome size=395142899, which may cause seg-fault at the mapping step. Re-run genome generation with recommended --genomeSAindexNbases 13

EXITING because of fatal ERROR: could not open temporary bam file: ./_STARtmp//BAMsort//b34
SOLUTION: check that the disk is not full, increase the max number of open files with Linux command ulimit -n before running STAR
Jan 29 11:38:58 ...... FATAL ERROR, exiting

Je ne pense pas que ce soit une erreur de création de l'index du génome, puisque certains échantillons s'alignent avec succès sur celui-ci. Il doit s'agir soit d'un problème de nombre de fichiers temporaires ouverts, soit d'un problème de mémoire utilisée ? Y a-t-il des paramètres que vous pouvez modifier de votre côté pour que ces analyses fonctionnent ?

Merci d'avance et très bonne journée,
Amandine

abretaud · Février 2, 2021, 9:05

Salut Amandine,
Est-ce que tu peux partager ton historique avec moi (mail en @irisa.fr) pour que je jette un œil aux jobs qui ont échoué ?
Anthony

a-velt · Février 9, 2021, 12:36

Salut Anthony,

Désolée je n'avais pas vu ta réponse ! Normalement tu as un historique partagé du nom de "imported: Formation RNAseq - Données myzus", avec un run STAR en rouge.

Merci pour ton aide
Amandine

abretaud · Février 18, 2021, 10:54

Salut,
À mon tour de ne pas avoir vu ta réponse, désolé !
Pour ton problème, ce n'est déjà pas un problème de ram. Peut-être un problème de nombre de fichiers ouverts sur le noeud de calcul. Tu peux tenter de relancer le job ? avec un peu de chance il passera ce coup-ci
Anthony

a-velt · Février 18, 2021, 12:55

Oui en fait j'ai l'impression que c'est aléatoire, ça a fonctionné pour certains participants de la formation pas pour d'autres. Du coup je me demandais si ça pouvait être stabilisé. Mais si ce n'est pas possible, je vais dire à la personne concernée par cette erreur de relancer pour voir.

Merci et à++
Amandine

dbenaben · Mars 2, 2021, 4:42

Bonjour,

Juste une précision à propos de l'erreur:

EXITING because of fatal ERROR: could not open temporary bam file: ./_STARtmp//BAMsort//b34
SOLUTION: check that the disk is not full, increase the max number of open files with Linux command ulimit -n before running STAR

La limite suggéré (ulimit -n) a déjà été augmenté (de 1024 à 131072) sur les noeuds de calcul.
Je pense donc que ce n'est pas ça.

Il est possible qu'un espace temporaire sur un noeud de calcul est saturé causant une erreur. Mais cela reste à mon avis assez exceptionnel.

Avez-vous toujours ce type d'erreur ?

a-velt · Mars 8, 2021, 7:46

Bonjour,

Je pense que l'erreur est aléatoire ou peut-être selon le nombre de jobs déjà présents/fichiers ouverts sur le nœud où est lancé mon job ? Peu importe, je pense sérieusement passer à HISAT, un autre aligneur RNAseq: STAR étant connu pour ces problèmes d'utilisation de mémoire/grand nombre de fichiers ouverts.

Merci beaucoup pour votre aide.
Amandine