R语言 转换metascape GO结果中的gene name为ensembl ID
# 安装并加载必要的包
if (!requireNamespace("AnnotationDbi", quietly = TRUE)) {
install.packages("AnnotationDbi")
}
if (!requireNamespace("org.Hs.eg.db", quietly = TRUE)) {
install.packages("org.Hs.eg.db")
}
library(AnnotationDbi)
library(org.Hs.eg.db)
# 定义函数,将基因名转换为对应的Ensembl ID
convert_gene_name_to_ensembl <- function(gene_name_vector) {
# 使用 egSYMBOLtoENTREZID 函数转换基因名到Entrez ID
entrez_id_vector <- org.Hs.egSYMBOLtoENTREZID(gene_name_vector)
# 使用 keys 函数从org.Hs.eg.db数据库中获取Ensembl ID
ensembl_id_vector <- org.Hs.egENZYMEIDtoENTREZID(entrez_id_vector, "ENSEMBL")
# 返回Ensembl ID向量
return(ensembl_id_vector)
}
# 示例使用
gene_names <- c("TP53", "BRCA1", "BRCA2")
ensembl_ids <- convert_gene_name_to_ensembl(gene_names)
print(ensembl_ids)
这段代码定义了一个函数convert_gene_name_to_ensembl
,它接受一个基因名的向量作为输入,并返回对应的Ensembl ID的向量。代码使用了org.Hs.eg.db
包中的egSYMBOLtoENTREZID
和egENZYMEIDtoENTREZID
函数来完成从基因名到Ensembl ID的转换。最后,代码示例展示了如何使用这个函数来转换一个包含几个基因名的向量。
评论已关闭