design_1563 = modelmatrix~gse_1563$Outcome data = pData_1563fit_1563 = lmFiteMat_1563_scaled design_1563fit_1563 = eBayesfit_1563tT_1563 - topTablefit_1563 genelist=fData_1563 Gene Symbol n = Inf adj
这些R代码用于基因表达数据分析。以下是每个代码的解释和分析:
-
design_1563 = model.matrix(~gse_1563$Outcome, data = pData_1563)- 创建一个线性模型的设计矩阵,其中“Outcome”是样本的分类变量,pData_1563是一个包含样本信息的数据框。 -
fit_1563 = lmFit(eMat_1563_scaled, design_1563)- 对基因表达数据(eMat_1563_scaled)进行线性回归拟合,使用设计矩阵(design_1563)来建立模型。 -
fit_1563 = eBayes(fit_1563)- 对拟合的线性模型进行贝叶斯调整以计算基因的表达水平。 -
tT_1563 <- topTable(fit_1563, genelist=fData_1563[, "Gene Symbol"], n = Inf, adjust.method = "BH", sort.by = "p")- 从贝叶斯调整后的结果中提取前N个差异表达的基因,并将它们与基因注释信息(fData_1563)中的基因符号匹配。 -
tT_1563$ID <- unlist(lapply(strsplit(tT_1563$ID, " /// ", 1),[, 1))- 将基因注释信息中的多个基因符号分隔符“///”分开,并只保留第一个符号。 -
tT_1563_filtered <- tT_1563 %>% filter(!is.na(tT_1563$ID))- 过滤掉没有基因符号的基因。 -
tT_1563_filtered_top <- tT_1563_filtered[1:500,]- 选择前500个差异表达的基因。 -
design_46474 = model.matrix(~gse_46474$Outcome, data = pData_46474)- 创建第二个数据集的设计矩阵。 -
fit_46474 = lmFit(eMat_46474, design_46474)- 对第二个数据集的基因表达数据进行线性回归拟合。 -
fit2_46474 = eBayes(fit_46474)- 对第二个数据集的线性模型进行贝叶斯调整。 -
tT_46474 <- topTable(fit2_46474, genelist=fData_46474[, "Gene Symbol"], n = Inf, adjust.method = "BH", sort.by = "p")- 从第二个数据集的贝叶斯调整结果中提取前N个差异表达的基因,并将它们与基因注释信息(fData_46474)中的基因符号匹配。 -
tT_46474$ID <- unlist(lapply(strsplit(tT_46474$ID, " /// ", 1),[, 1))- 将基因注释信息中的多个基因符号分隔符“///”分开,并只保留第一个符号。 -
tT_46474_filtered <- tT_46474 %>% filter(!is.na(tT_46474$ID))- 过滤掉没有基因符号的基因。 -
tT_46474_filtered_top <- tT_46474_filtered[1:500, ]- 选择第二个数据集中前500个差异表达的基因。 -
inter <- intersect(tT_1563_filtered_top$ID, tT_46474_filtered_top$ID)- 计算两个数据集共同具有的基因。 -
inter_filtered <- c("CASP4", "PROX1", "GRIK1", "INPP5F" , "FCGR1A" ,"SFTPB", "SIM2", "MTSS1L", "UBE2H", "SOX13" , "TMSB10", "ELF3", "LMAN2" , "MAPT", "CRCP", "IL4R" , "TFE3" , "FABP5")- 选择具有生物学意义的基因。 -
tT_1563_filtered_top_inter <- tT_1563_filtered_top %>% filter(tT_1563_filtered_top$ID %in% inter_filtered)- 选择第一个数据集中具有生物学意义的共同基因。 -
tT_46474_filtered_top_inter <- tT_46474_filtered_top %>% filter(tT_46474_filtered_top$ID %in% inter_filtered)- 选择第二个数据集中具有生物学意义的共同基因。 -
eMat_1563_scaled_top_inter_genes <- eMat_1563_scaled[rownames(tT_1563_filtered_top_inter),]- 选择第一个数据集中的共同基因的基因表达数据。
通过这些R代码,可以分析两个基因表达数据集中的共同基因,并选择具有生物学意义的基因进行进一步分析。这些代码还可以用于线性回归拟合和贝叶斯调整,以计算基因的表达水平
原文地址: https://www.cveoy.top/t/topic/fr3u 著作权归作者所有。请勿转载和采集!