DESeq2差异基因筛选:Log2FoldChange、P值和平均表达量过滤
这段R代码展示了如何筛选DESeq2分析结果中的差异表达基因。
代码解释:
-
deseq2.res2 <- deseq2.res[symbol$ENSEMBL,]- 这行代码首先根据基因的ENSEMBL ID从
deseq2.res对象中提取对应的差异表达分析结果。 - 假设您有一个名为
symbol的数据框,其中包含基因名和ENSEMBL ID的对应关系。 - 提取的结果存储在新的
deseq2.res2对象中。
- 这行代码首先根据基因的ENSEMBL ID从
-
deseq2.res2 <- subset(deseq2.res2, abs(deseq2.res2$log2FoldChange) > 1 & deseq2.res2$pvalue < 0.01 & deseq2.res2$baseMean > 100)- 这行代码使用
subset函数对deseq2.res2中的基因进行筛选,只保留符合以下条件的基因:abs(deseq2.res2$log2FoldChange) > 1:基因的log2折叠变化的绝对值大于1,表示基因表达量变化至少为2倍。deseq2.res2$pvalue < 0.01:差异表达的p值小于0.01,表示差异表达具有统计学意义。deseq2.res2$baseMean > 100:基因在所有样本中的平均表达量大于100,用于排除低表达基因的假阳性结果。
- 这行代码使用
总结:
通过这段代码,您可以从DESeq2分析结果中筛选出具有显著差异表达的基因,并根据log2折叠变化、p值和平均表达量进行进一步的分析和解读。
原文地址: https://www.cveoy.top/t/topic/fRP7 著作权归作者所有。请勿转载和采集!