这段R代码展示了如何筛选DESeq2分析结果中的差异表达基因。

代码解释:

  1. deseq2.res2 <- deseq2.res[symbol$ENSEMBL,]

    • 这行代码首先根据基因的ENSEMBL ID从 deseq2.res 对象中提取对应的差异表达分析结果。
    • 假设您有一个名为 symbol 的数据框,其中包含基因名和ENSEMBL ID的对应关系。
    • 提取的结果存储在新的 deseq2.res2 对象中。
  2. deseq2.res2 <- subset(deseq2.res2, abs(deseq2.res2$log2FoldChange) > 1 & deseq2.res2$pvalue < 0.01 & deseq2.res2$baseMean > 100)

    • 这行代码使用 subset 函数对 deseq2.res2 中的基因进行筛选,只保留符合以下条件的基因:
      • abs(deseq2.res2$log2FoldChange) > 1:基因的log2折叠变化的绝对值大于1,表示基因表达量变化至少为2倍。
      • deseq2.res2$pvalue < 0.01:差异表达的p值小于0.01,表示差异表达具有统计学意义。
      • deseq2.res2$baseMean > 100:基因在所有样本中的平均表达量大于100,用于排除低表达基因的假阳性结果。

总结:

通过这段代码,您可以从DESeq2分析结果中筛选出具有显著差异表达的基因,并根据log2折叠变化、p值和平均表达量进行进一步的分析和解读。

DESeq2差异基因筛选:Log2FoldChange、P值和平均表达量过滤

原文地址: https://www.cveoy.top/t/topic/fRP7 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录