J'aurai besoin d'un avis sur les multiples possibilités d'améliorer la qualité du fichier bam.
Tout d'abord je suis partie sur un bowtie2 :
bowtie2 --threads $SLURM_CPUS_PER_TASK -x ../index_btw2/mm10/mm10 -U ../../01-qualitycontrol/WT/WT-IP-051218_S5_R1_001.fastq -S WT-IP-051218_S5_R1_001.fastq.sam
puis
samtools sort WT-050318_S1_R1_001.sam | samtools view -hbS > WT-050318_S1_R1_001.bam
samtools index WT-050318_S1_R1_001.bam
alors déjà là j'aurai du définir la qualité minimum des alignements que je conserve, donc samtools view -hbS -q 30 ; c'est bien ça ?
Ensuite je souhaiterais retirer les multiples reads. C'est possible de le faire directement sur la ligne samtools view ? type >> samtools view -hbS -q 30 -F 0x04 ?
Dois-je conserver un output des unmapped ?
Ensuite pour les dupliqués j'utilise picard MarkDuplicates mais j'avoue ne pas trop savoir comment analyser ce que j'en obtiens.
Voilà. Désolé pour mes questions sûrement assez naïves mais plutôt que de lancer des analyses de plusieurs heures avec des erreurs dedans je préfère demander avant !
Merci pour vos réponses. Le lien du tuto je l'avais bien conservé de la formation mais c'est du bowtie1 donc je suis moins "familié" avec le bowtie2. Je cherchais surtout à savoir si mon filtrage est ok (-q 30 -F4), pas suffisant voir même faux.