Bonjour @team.ifbcorecluster,
J'avais reçu ce message sur ma boite mail mais je vous remet ma réponse car pas sûr que vous l'ayez vue !
Malheureusement je ne peux pas essayer sur un plus petit jeu de données car je n'analyse déja avec mon script que les données d'un seul échantillon (deux fichiers .CEL issus d'une analyse de CNV par OncoScan)
J'ai tenté de relancer mon script avec la commande suivante :
$ sbatch HRD_EACON_job.sh
avec
$ vim HRD_EACON_job.sh
#!/bin/bash
Requirements
#SBATCH --job-name=HRD_EACON
#SBATCH --mem=60GB
#SBATCH --nodes=2
#SBATCH --cpus-per-task=8
#SBATCH --mem-per-cpu=8GB
#SBATCH --mincpus=4
Rscript HRD_EACON.R
Pour le wd :
dans le dossier GSE111711_RAW/ figurent n fichiers *.CEL
Pour T0005 les fichiers pour reproduire exactement ce script sont les suivants:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSM3037868
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSM3037869
Pour le script :
Dans HRD_EACON.R tous les packages se chargent bien sans message d'erreur. L'erreur survient après la fonction Segment.ff( ):
first identify a working directory
setwd("GSE111711_RAW/")
identify samples
sample_sheet <- data.frame(File = Sys.glob("*.CEL"))
identify sample names
sample_sheet$Sample <- str_extract(sample_sheet$File, "T[:digit:]{4}")
sample_list <- levels(factor(sample_sheet$Sample))
Raw data processing for Affymetrix OncoScan / OncoScan_CNV data for the sample
i = 1
sample_sheet_i <- sample_sheet %>% filter(Sample == as.character(sample_list[i])) %>% droplevels()
print(sample_list[i])
OS.Process(ATChannelCel = as.character(sample_sheet_i[1,1]),
GCChannelCel = as.character(sample_sheet_i[2,1]),
apt.version = "2.4.0",
samplename = sample_list[i],
genome.pkg = "BSgenome.Hsapiens.UCSC.hg38",
apt.build = "na36.r1",
force = TRUE)
L2R & BAF Segmentation
Segment.ff(RDS.file = paste(sample_list[i],"/",sample_list[i],"_OncoScan_hg38_processed.RDS",sep = ""),
segmenter = "ASCAT")
Message :
[cpu-node-20.ifb.local:172961] Loading data from T0005/T0005_OncoScan_hg38_processed.RDS ...
[cpu-node-20.ifb.local:172961] Sample : T0005
[cpu-node-20.ifb.local:172961] Loading BSgenome.Hsapiens.UCSC.hg38 ...
[cpu-node-20.ifb.local:172961] Filtering BAF...
[cpu-node-20.ifb.local:172961] ASPCF segmentation ...
[1] Sample T0005 (1/1)
[cpu-node-20.ifb.local:172961] Recentering ...
[cpu-node-20.ifb.local:172961] ... using the most centered of populated peaks.
[cpu-node-20.ifb.local:172961] Smoothing L2R (for plots)...
*** caught segfault ***
address (nil), cause 'memory not mapped'
Traceback:
1: runmed(x, k = filtWidth, endrule = "median")
2: runmed(x, k = filtWidth, endrule = "median")
3: medianFilter(x, k)
4: madWins(use.y, tau = tau, k = k, digits = digits)
5: copynumber::winsorize(data = cndf, pos.unit = "bp", method = "mad", k = 5, tau = 1, verbose = FALSE)
6: Segment.ASCAT(data = list(data = list(Tumor_LogR.ori = list(T0005 = c(0.174520790576935, 0.349083930253983, [ ... longue liste jusqu'à ... ] ,1145772L, 1145794L, 1145813L ), masked = NULL))), out.dir = "T0005")
7: do.call(paste0("Segment.", toupper(segmenter)), list(data = my.data, out.dir = dirname(RDS.file), ...))
8: Segment.ff(RDS.file = paste(sample_list[i], "/", sample_list[i], "_OncoScan_hg38_processed.RDS", sep = ""), segmenter = "ASCAT")
An irrecoverable exception occurred. R is aborting now ...
/var/spool/slurm/slurmd/job9715588/slurm_script: line 10: 172961 Segmentation fault (core dumped) Rscript HRD_EACON.R
Encore un grand merci pour votre aide !! Je reste très intrigué car en lançant ces commandes il y a un mois sur le https://rstudio.cluster.france-bioinformatique.fr/ ça marchait bien !!
Bon courage et bonne fin de journée
Cordialement
Guillaume