Index STAR 2.7.5a pour hg38 @team.bank

Bonjour,
j'utilise STAR 2.7.5a sur le genome hg38. L'index n'étant pas encore dans les banques communes, je l'ai généré (et testé). Vous pouvez le récupérer dans
/shared/projects/lxactko_analyse/RASflow/index/STAR
Il a été généré avec

module load star/2.7.5a
STAR  --runThreadN 20 --runMode genomeGenerate --genomeDir STAR --genomeFastaFiles /shared/bank/homo_sapiens/hg38/fasta/hg38.fa

Merci!

Magali

Hop /shared/bank/homo_sapiens/hg38/star-2.7.5a

Merci !

J ai une proposition : Est-ce que l' on pourrait ajouter les fichiers correspondants à l annotation de transcripts pour les junctions, en cas de recherche d épissage (splicing) ? ça peut aider sur quelques annotations,sans causer de problèmes pour ceux qui n' en ont pas besoin.
ça se fait avec le flag :
--sjdbGTFfile ,
avec e.g
/shared/bank/homo_sapiens/hg19/gff/gencode.v19.annotation.gtf

sur la commande ,et ça génère 4 fichiers de plus sur l index:

sjdbInfo.txt
sjdbList.fromGTF.out.tab
sjdbList.out.tab
transcriptInfo.tab

Réferencié par le tuto de STAR:

# --sjdbGTFfile species the path to the file with annotated transcripts in the standard GTF
# format. STAR will extract splice junctions from this file and use them to greatly improve
# accuracy of the mapping. While this is optional, and STAR can be run without annotations,
# using annotations is highly recommended whenever they are available. Starting from 2.4.1a,
# the annotations can also be included on the fly at the mapping step.

J' ai déjà les index incluant ces fichiers de hg19 et mm10, que je pourrais ajouter sur la bank je me suis permise.

Merci Maria.
Perso je préfère inclure l'annotation pendant le mapping car je change régulièrement de version. Mais je ne suis pas sure que ce soit le plus efficace... Toujours est-il que si l'annotation est inclue pendant la génération de l'index, il faut être sûr de bien conserver l'information de la version.

Je pense qu' en tout cas l annotation doit se faire avec la même version de ref que l' alignement et index, donc ça doit être pareil de le faire en avance.

Mais, je connais pas des utilités plus spéciales qui nécessitent une autre annotation. J' utilise ces fichiers pour les info des jonctions de transcripts , et ça m' aurait facilité de ne pas garder un Index de plus dans mon home/ ! Mais si ça crée de confusion, on garde l' index courant.

1 J'aime

J'avoue pas tout comprendre :unamused:

Dites-moi quand vous dégagez un consensus.

Un avis @team.rnaseq ?

Je n'ai pas les idées très claires, mais il me semble que cela peut faire partie des bonnes pratiques que, quitte à faire un index STAR, lui adjoindre le fichier GTF.
Si on part sur ce choix, il faut: trouver un GTF adéquat, relancer l'indexation, et ajouter un lien symbolique du GTF dans le répertoire de l'index STAR.
Mais c'est à discuter...

1 J'aime