在R语言中,可以使用GSEA(Gene Set Enrichment Analysis)函数进行基因集富集分析。其中,SYMBOL(Symbol Identifier)是一种常用的基因标识符。下面是使用SYMBOL进行GSEA()分析的示例代码:

library(clusterProfiler)
library(org.Hs.eg.db)

# 读取基因表达数据
data <- read.table("gene_expression.txt", header = T, sep = "\t", row.names = 1)

# 设定基因集合
geneSet <- c("GO:0008150", "GO:0003674", "GO:0005575")

# 将SYMBOL转换为Entrez ID
geneIDs <- bitr(row.names(data), fromType = "SYMBOL", toType = "ENTREZID", OrgDb = org.Hs.eg.db)

# 进行GSEA分析
result <- GSEA(geneList = geneIDs$ENTREZID, 
               nPerm = 1000, 
               minSize = 10, 
               maxSize = 500, 
               verbose = F, 
               pvalueCutoff = 0.05, 
               geneSet = geneSet)

# 输出富集分析结果
result@result

在上面的代码中,首先使用clusterProfiler和org.Hs.eg.db库加载基因表达数据和基因注释信息。然后,设定需要分析的基因集合(这里使用了Gene Ontology中的三个分子功能注释)。接着,使用bitr函数将基因的SYMBOL转换为Entrez ID。最后,使用GSEA函数进行富集分析,并输出分析结果。

R语言使用SYMBOL进行 GSEA分析

原文地址: https://www.cveoy.top/t/topic/bgmb 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录