R语言使用SYMBOL进行 GSEA分析
在R语言中,可以使用GSEA(Gene Set Enrichment Analysis)函数进行基因集富集分析。其中,SYMBOL(Symbol Identifier)是一种常用的基因标识符。下面是使用SYMBOL进行GSEA()分析的示例代码:
library(clusterProfiler)
library(org.Hs.eg.db)
# 读取基因表达数据
data <- read.table("gene_expression.txt", header = T, sep = "\t", row.names = 1)
# 设定基因集合
geneSet <- c("GO:0008150", "GO:0003674", "GO:0005575")
# 将SYMBOL转换为Entrez ID
geneIDs <- bitr(row.names(data), fromType = "SYMBOL", toType = "ENTREZID", OrgDb = org.Hs.eg.db)
# 进行GSEA分析
result <- GSEA(geneList = geneIDs$ENTREZID,
nPerm = 1000,
minSize = 10,
maxSize = 500,
verbose = F,
pvalueCutoff = 0.05,
geneSet = geneSet)
# 输出富集分析结果
result@result
在上面的代码中,首先使用clusterProfiler和org.Hs.eg.db库加载基因表达数据和基因注释信息。然后,设定需要分析的基因集合(这里使用了Gene Ontology中的三个分子功能注释)。接着,使用bitr函数将基因的SYMBOL转换为Entrez ID。最后,使用GSEA函数进行富集分析,并输出分析结果。
原文地址: https://www.cveoy.top/t/topic/bgmb 著作权归作者所有。请勿转载和采集!