Quel format favorisé entre vcf.gz ou bcf

Bonjour à tous,

Je travaille de plus en plus avec la suite bcftools qui utilises des fichiers de variant préférentiellement compressés, vcf.gz ou bcf.

Ma question est toute simple, est ce que l'un de ces formats est plus efficace en compression/vitesse d'utilisation ?
Je ne suis pas sûre que les bcf soit facilement utilisable par l'ensemble des outils dédiés à la manipulation des fichiers VCF, mais pour des travaux "simples" intersection/merge sur des gros fichiers les bcftools sont quand même efficace, alors ça peut valoir le coup d'optimiser encore leur utilisation.

Bonne journée à tous, et joyeux Noël !!

Maria

PS: un petit ping spécial @team.dnaseq

Salut Maria,

Je ne pourrai pas te répondre, je n'ai vraiment jamais travaillée avec des bcf, il me semble que c'était classiquement utilisé surtout à l'époque ou samtools+bcftools était utilisé pour caller les variants mais depuis le vcf.gz tabixé est quand même le format le plus utilisé comme tu dis.

Bonnes fêtes :slight_smile: !

Merci pour ton avis!

Passe de bonnes fêtes toi aussi! à très vite