Soumission de données à ENA

Bonjour,

J'ai une question générale, qui n'est lié à aucun service de l'IFB. J’espère que ma question trouvera une réponse ici. Si ce n'est pas le lieu vous pouvez la supprimer ou me demander de le faire

J'espère que vous passez un été agréable. Je passe le mien en essayant de soumettre des données à ENA ( European Nucleotide Archive). Je cherche donc quelqu’un qui a déjà fait ça qui peut m'éclairer.

J'ai crée une Study , plusieurs Samples et des Runs aux quels j'ai associé des données (fastq pour les RNASeq et sam pour les séquencages PacBio).

Je souhaite maintenant ajouter plusieurs Data Analyses pour y mettre des assemblages de transcriptomes, les annotations etc ...

Le problème c'est que mes assemblages ont été faits avec des données (fastq) qui sont associés à plusieurs samples différents. Or, d'après ce que je comprends, une analyse dans ENA ne peut être relié qu'à un seul sample. Me voila donc coincé.

Par avance merci pour toute aide.
Vladimir

J'ai fini par recevoir une réponse du helpdesk ebi. Je met ça ici. En espérant que ça puisse servir à d'autres.

You can group multiple samples by following the instructions below. It's
tailored a little to programmatic submission so if you are using the using
Webin Portal for an interactive submission, you basically just need to add a
'custom field' called 'sample composed of' to your spreadsheet and fill this
in with reference to the relevant samples. Please see intructions in detail
below:

Registering Sample Groups:

In the case where a run/experiment/assemblies references multiple samples you
can create a virtual sample that represents a group of samples.

Here's how to do this:

1 - Register a virtual sample that represents the group using the closest
checklist possible and using ALL the attributes that the samples have in
common (it is the same procedure as registering a normal sample but with a few
tweeks).

2 - Add a sample description clarifying that it is a virtual sample, e.g.

"This sample is a virtual sample of assembled raw reads from multiple physical
samples of genome and is composed of physical samples
<ERSXXXXX1, ERSXXXXX2, ERSXXXXX3 etc>."

3 - Add the following as a user defined attribute referencing the component
samples:

TAG: sample composed of
VALUE: <ERSXXXXX1, ERSXXXXX2, etc.>

Make sure you replace all the '< >' brackets with the correct accessions of
the samples within the group and any other specified values.

Then, when you register your assembly with a sample, just reference this
virtual grouped sample. This virtual sample will not be existing anywhere and
hence is called virtual. It basically references 2 samples in the assembly.

2 « J'aime »

Merci pour le partage !