NCBI 是美国国家生物技术信息中心(National Center for Biotechnology Information)的缩写,是一个提供生物医学和基因组学数据库及工具的国家级资源。
进入官网(https://www.ncbi.nlm.nih.gov/)后界面如下:
1、下拉列表,可指定查询的数据库。
2、输入关键词检索。
3、资源库导航栏,点击后可查看资源库涵盖的数据库,每个数据库均有具体说明。
4、数据提交、下载、分析工具和帮助指南等
5、常用工具和数据库
目前NCBI是查询基因信息最常用的数据库之一,本期就来详细介绍下具体的使用方法。以人TP53为例,首先打开1的下拉列表,选择“gene”,输入TP53查询,查询页面如下图所示,可通过基因名称、ID、全称、种属以及别称来进一步确认。
点击基因名称进入详情界面,最上方显示目的基因名称、种属、ID和信息最新更新日期,下方则是详细信息,这里简单描述下各个版块的内容。
Summary:包括基因官方名称、别称和功能等基本信息。
Genomic context:显示目的基因在染色体上的位置,以及有关基因的主要序列位置的信息。
Genomic regions, transcripts, and products:包含目的基因序列版本信息、转录本信息和SNP信息。(SNP:单核苷酸多态性,主要是指在基因组水平由单个核苷酸的变异所引起的DNA序列多态性。)
Expression:显示目的基因在多个组织中的表达情况。
Bibliography:PubMed中收录的目的基因相关文献,有关目的基因功能的研究论文单独列在GeneRIFs版块。
Phenotypes:显示目的基因对表型,特别是疾病表型的影响。包含BioGRID、GTR、PheGenl三个数据库的链接。BioGRID是一个收集了蛋白质、化学物质(包括已知药物)和遗传相互作用数据库;GTR是美国国立卫生研究院基因检测登记中心,提供遗传疾病检测的详细信息;PheGenl为表型-基因型整合期,整合了全基因组关联研究(GWASs)的相关信息,主要用于研究遗传变异与人类疾病之间的关系。
Variation:一般包含dbSNP、dbVar、ClinVar三个数据库的信息。dbSNP可查看长度小于50bp的基因突变;dbSNP可查看长度较长的基因突变以及复杂重排;ClinVar提供医学相关的基因突变(仅适用于人类),
HIV-1 interactions:包含Replication interactions和Protein interactions两个版块。Replication interactions提供HIV-1感染和复制所必需的人类蛋白质。Protein interactions提供已被证明与HIV-1蛋白相互作用的人类蛋白质。
Pathways from PubChem:来自美国国立卫生研究院的公共化学数据库,该部分主要提供目的基因参与的信号通路的相关信息,可用于分析和解释分子机制。
Interactions:收录蛋白相互作用的相关信息,均附有对应参考文献。
General gene information:包含同源性、基因本体论、基因型、基因探针等内容。
General protein information:提供该基因编码的蛋白名称。
界面最后NCBI Reference Sequences (RefSeqs)和Related Sequences两个版块均可用于查找目的序列。Related Sequences中多为研究人员自己提交的碱基和蛋白质序列,而NCBI Reference Sequences (RefSeqs)中是针对该基因的特定基因的NCBI参考序列,是最常用的序列集合。这里小编重点介绍如何使用NCBI Reference Sequences (RefSeqs)查看目的基因序列信息。
mRNA一般重点关注NM开头的,非编码RNA一般会以NR开头,XM为生物信息预测的转录本信息。可以从转录本编号后边的“. x”来判断该转录本更新的次数,更新的次数越多代表该转录本研究的越多,被研究的时间也越早。
很多情况下,一个基因有多个转录本,通常我们会选择经典转录本,即研究最多的转录本进行实验。除了上述提到的通过编号来粗略判断,将NP序列与UniProt的Swiss-Prot数据库中的序列比对更为准确,具体原因可查看“常用网站介绍|“玩转”蛋白百科大全——UniProt(上)”这篇文章哦。经比对,NM_000546.6是TP53的经典转录本之一。点击NM_000546.6获取转录本详细信息。
点击“CDS”自动跳转页面最下方,并用深色标注编码区序列,点击右下角“FASTA”可获取FASTA格式的序列。
本期主要介绍了NCBI基因界面包含的内容以及如何查找目的序列,下期将继续介绍NCBI其他常用功能,感兴趣的小伙伴可以留意一下哦~
汉恒专营工具病毒十余载,如有基因调控相关技术问题,欢迎随时咨询!