Between-table Correlation - éliminer les redondances - probleme datamatrix en double

Bonjour,

Je rencontre un problème pour utiliser l'outil between-table Correlation, pour éliminer les redondances.
J'ai une Datamatrix que j'aimerais simplifier, donc je la rentre deux fois dans l'outil. Les paramètres sont : sample in column; un spearman (le plus adapté à mon jeu de données); reorder variables : Yes

Sauf qu'il n'accepte pas deux Datamatrix identique.
Comment puis-je palier à ce problème ?

En vous souhaitant une belle journée
Cordialement

Bonjour,
J'ai testé dans les mêmes conditions ce matin et je n'ai pas rencontré de problème. Le paramètre "samples in column" a-t-il bien été mis 2 fois ?
Si oui, est-il possible de partager l'historique ? (Possibilité de le faire nominativement dans Galaxy ou bien de m'envoyer le lien de partage par MP)
Mélanie

Bonjour @DelphineV

Le soucis rencontré était une atteinte du maximum de mémoire de l'outil. Une augmentation du quota de RAM alloué à l'outil a été faite, pouvez-vous s'il vous plaît relancer votre job pour voir si l'augmentation effectuée est suffisante ?

Par avance merci de votre retour,
Mélanie

Bonjour Mélanie,

J'ai relancé l'outil et j'ai toujours le même message d’erreur..
Si mes données sont vraiment trop lourdes, est ce qu'il existe une autre alternative pour les simplifier ?

Merci beaucoup pour votre aide
A bientôt
Isabelle et Delphine

Bonjour,
En effet, l'augmentation a été trop timide. Je continue mes tests et reviens vers vous.
En termes d'alternatives, dans votre cas de figure c'est compliqué. Il y a des choses qu'on pourrait faire pour contourner le problème (avoir une pré-étape de découpage du jeu puis recombiner après filtre et recroiser), mais bien que possible ce serait du "bricolage" donc de préférence essayons de régler le problème de mémoire en priorité :slightly_smiling_face:

Bonjour Mélanie,
J'ai re-filtré mes données : je suis passé de 17 000 lignes à 9 700 dans la dataMatrix et l'outil de corrélation fonctionne !
Il me semble qu'avec la haute résolution la filtration que j'ai appliqué est correct, cependant, je ne sais pas si pour d'autres utilisateurs ce serais limitant
Merci beaucoup pour votre aide
A bientôt
Delphine

Bonjour Delphine,
Pour information, il y a eu une petite coquille lors de l'augmentation de quota, mais maintenant que celle-ci est corrigée, l'outil passe bien avec le jeu de données initial à 17000 lignes.
Je note du coup le ticket comme résolu.
Bonne journée,
Mélanie