Utilisation de l'option -taxids dans blast

Bonjour,

Je voudrais utiliser blastp en commande line pour identifier des séquences protéiques.
Je cherche contre la database nr mais je sais que mes séquences ont été isolées chez E. coli et je voudrais donc restreindre ma recherche à E. coli ou aux Enterobacteriaceae afin d'accélérer ma requête en limitant le nombre de candidats.

J'ai utilisé la commande slurm suivante :


#!/bin/bash

### Job name
#SBATCH --job-name=blast_hpi_region

### Requirements
#SBATCH --partition=fast
#SBATCH --cpus-per-task=1
#SBATCH --mem-per-cpu=1GB
#SBATCH --account=ecoli_hpi_pres_abs

#SBATCH --output=slurm-outputs/blast_hpi_region.out
#SBATCH --error=slurm-outputs/blast_hpi_region.err

### Email
#SBATCH --mail-user=manolo.mischler@inserm.fr
#SBATCH --mail-type=ALL

module load blast
module load sqlite 

blastp -db /shared/bank/nr/current/blast/nr -query test2.faa -out test2.txt  -taxids 562   

## taxids 562 = E. coli

J'ai également lancé le même script en augmentant la mémoire à 500G après avoir vu que cela était recommandé en travaillant avec des bases de données de la taille de nr.

Toutefois, dans tous les cas je vois écris dans le fichier .err :


The -taxids command line option requires additional data files. Please see the section 'Taxonomic filtering for BLAST databases' in https://www.ncbi.nlm.nih.gov/books/NBK569839/ for details.

Pourtant, il y a bien des fichiers avec des informations sur la taxonomy dans la database (dans /shared/bank/nr/current/blast/) :

taxdb.btd 
taxdb.bti 
taxonomy4blast.sqlite3

Cependant ces fichiers n'ont pas l'air d'être reconnus

Merci pour votre aide et bonne soirée