R语言clusterProfiler包: 将ENSEMBL ID转换为基因SYMBOL
使用R语言clusterProfiler包转换ENSEMBL ID为基因SYMBOL
这段R代码展示了使用clusterProfiler包进行基因表达差异分析的预处理步骤, 主要目标是将基因的ENSEMBL ID转换为更易理解的基因SYMBOL:
library('clusterProfiler')
symbol2 <- bitr(rownames(deseq2.res2),
fromType='ENSEMBL', toType=c('SYMBOL', 'ENTREZID'), OrgDb='org.Hs.eg.db')
deseq2.res3 <- deseq2.res[symbol2$ENSEMBL,]
rownames(deseq2.res3) <- symbol2$SYMBOL
代码解析:
-
bitr函数: 该函数用于将基因ID从一种类型转换为另一种类型, 此处将ENSEMBL ID转换为SYMBOL和Entrez ID。rownames(deseq2.res2): 提取差异表达分析结果deseq2.res2的行名, 即基因的ENSEMBL ID。fromType='ENSEMBL': 指定输入ID类型为ENSEMBL ID。toType=c('SYMBOL', 'ENTREZID'): 指定要转换的目标ID类型, 包括SYMBOL和Entrez ID。OrgDb='org.Hs.eg.db': 指定使用的数据库为org.Hs.eg.db, 该数据库包含人类基因的注释信息。
-
提取对应结果: 根据转换后的SYMBOL, 从原始结果
deseq2.res中提取对应基因的表达差异分析结果, 并存储在deseq2.res3中。 -
设置行名: 将
deseq2.res3的行名设置为转换后的基因SYMBOL, 方便后续分析和可视化。
这段代码的作用是将基因表达差异结果中的基因ID转换为更易于理解和解释的基因SYMBOL, 为后续的分析和可视化做好准备。
原文地址: https://www.cveoy.top/t/topic/fRQb 著作权归作者所有。请勿转载和采集!