Mixomics : normalisation des matrices et discrimination des groupes

Hello,
2 questions :

  1. I have 3 datasets : growth, transcript. and metabol. data. Is it necessary to normalize 3 dataset in the exactly the same way? What would you usually do for transcript. and metabol. data normalization ?

For separately analysis, we used to do normalization by sample and then log2-transformation for transcript data. And I have normalised metabol data per metabolite (min max scale) and per sample (quartile alignment). Anderson-Darling normality test give p-value < 2.2e-16 for all matrix after transformation.

But is it necessary to normalised all datasets in the same way for integration: which means double scale and the log2- transformation?

  1. I have samples from 5 genotypes and 4 conditions. How can I discriminate the groups by 2 hierarchical factors: first genotype then condition in the same time?

In plotvar plot: I could group samples by condition (by assign condition factor to this Y in scripts) or by genotype only, but when I tried genotype x condition, 20 groups seem too much…How can I cluster them like a heatmap so I can use both of the information?

thanks !

  1. j'ai trois jeux de données : phénotype de croissance de plantes, transcriptome et metabolome. est ce obligatoire de normaliser les 3 matrices exactement de la même manière ?? Quel type de normalisation feriez vous habituellement pour des données de transcriptome et métabolome ?

Lorsque l'on analyse les matrices une par une, on a utilisé : pour les donnée de transcriptome
une transformation log2, et par échantillon (alignement des quartiles avec des distributions qui sont équivalentes), et pour le métabolome une normalisation par métabolite (min max scale) et par échantillon également (alignement quartile). Anderson-Darling normality test donne des p-value < 2.2e-16 pour toutes les matrices après transformation.

Est ce nécessaire de normaliser avec les mêmes méthodes les différentes matrices : double scale ligne / colonne / + log2 ?

  1. J'ai des échantillons de 5 génotypes différents et 4 conditions de culture differentes. **Comment je peux discriminer les groupes par 2 facteurs hiérarchiques : le génotype et la condition de culture **

dans plotvar plot: Je peux seulement grouper les échantillons par condition (en assignant le facteur condition dans Y dans le scripts), ou par génotype. Mais en essayant genotype x condition, cela fait 20 groupes ce qui semble être trop... Comment puis je les clusteriser comme pour la heatmap avec les deux informations en meme temps ?

merci d'avance
bonne journée
Marina

Salut Kafka,

#Normalisation

Je ne crois pas qu'il faut normaliser de la même manière les trois omics. La normalisation sert par définition à transformer les données pour utilisé un test qui nécessite que les données suivent une loi normale. En bioinformatique/analyse de données on normalise les données pour "contrôler" les différents biais présent (technique et/ou biologique).
Du coups, les 3 omics sont générés par différentes techniques qui ont chacune leur propre biais et elles correspondent à des objet biologiques différents (métabolites et gènes),ont des plages de variabilité différentes également.

Ton but est de considérer ces 3 omics pour une intégration par pour les fusionner et passer un test statistique.

J'espère t'avoir aider, pour ta deuxième question j'ai pas de réponse qui me vient mais si jamais je te ferais signe.

A+ dans le :bus:

LK