NCBI保姆级使用教程(包含如何查找CDS、启动子、5‘UTR和3‘UTR、lncRNA序列)

article/2025/8/20 6:07:38

一、NCBI数据库简介

NCBI,全称为美国国家生物技术信息中心(National Center for Biotechnology Information),是美国国立卫生研究院(National Institutes of Health)的一个部门。NCBI成立于1988年,旨在促进生物医学研究,通过收集、存储和提供生物医学信息来加速科学和健康进步。

NCBI提供多种数据库和工具,用于研究遗传学、分子生物学和生物信息学等领域。其中最著名的数据库包括GenBank(一个公开的核酸序列数据库)、PubMed(一个医学文献数据库)、Protein(蛋白质序列数据库)和SNP(单核苷酸多态性数据库)等。

NCBI还开发了多种在线工具,如BLAST(基本局部对齐search工具),用于比较生物序列,当你只有一段DNA、RNA或蛋白序列的时候,你想知道它是什么,这时候BLAST:Basic Local Alignment Search Tool (nih.gov)就是一个很好的工具,BLAST能够快速比较核酸或蛋白质之间的相似性,帮助你快速找到相似的基因或者蛋白。这些资源对于研究人员、医生、学生和公众来说都是免费可用的,极大地促进了生物医学研究和教育。

二、NCBI数据库怎么用呢?

NCBI数据库是一个提供广泛生物医学信息的综合资源库,涵盖了基因、RNA、蛋白质序列等多个领域。NCBI收录了70000多种生物的核苷酸序列,每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。与专注于基因组检索的Ensembl数据库相比,NCBI的数据库内容更为广泛和综合。NCBI提供了多达36种不同的数据检索及分析工具,其主页面显示了不同的功能分区,以下是一个简要的使用教程:

1.访问NCBI官网:首先,打开浏览器并输入www.ncbi.nlm.nih.gov,进入NCBI的主页。

2.search文献:在主页的search框中输入您感兴趣的关键词,例如疾病名称、基因名称或特定的生物化学物质等。点击“Search”按钮进行search。

3.浏览search结果:search结果会列出相关的文献、基因、蛋白质等信息。您可以点击相应的链接查看详细信息。

4.使用PubMed:PubMed是NCBI提供的一个免费的文献检索系统。在主页上点击“PubMed”链接,进入PubMed search界面。您可以使用布尔运算符(AND,OR,NOT)来组合关键词进行更精确的search。

5.查找基因信息:在主页上点击“Gene”链接,进入基因数据库。在这里您可以search特定的基因,并获取其序列、功能、表达等信息。

6.查找蛋白质信息:点击“Protein”链接,进入蛋白质数据库。您可以search特定的蛋白质,了解其结构、功能、相互作用等信息。

7.使用BLAST:在主页上点击“BLAST”链接,选择合适的BLAST程序进行序列比对。

8.注册账号:为了使用一些高级功能,如保存search历史、创建个性化的工作区等,您可以在主页上注册一个NCBI账号。

9.学习资源:NCBI提供了许多学习资源,包括教程、视频、FAQ等,帮助用户更好地使用数据库。您可以在主页上找到这些资源。

三、如何查找CDS和蛋白序列?

进入NCBI网站,选择“Gene”,在search框中输入感兴趣的基因的名称、基因ID或相关的生物物种,以“P53”为例。

点击“search”按钮,系统会显示与您的查询相关的数据库条目列表,选择对应的物种,以“human”为例。

点击对应物种基因名,系统会显示与您的查询相关的数据库条目列表。包括基因的Summary、Genomic context和Genomic regions, transcripts, and products等。

在search结果中,找到“Genomic regions, transcripts, and products”条目,该页面显示了基因所有对应的转录本ID和蛋白ID,根据需求选择对应转录本,一般推荐MANE Select(MANE数据旨在收录和整理人类基因的转录本注释信息,并且提供编码基因最具代表性转录本和相应的蛋白质。)鼠标悬浮在转录本上,在转录本信息里可以看到“Status:MANE Select”。

另外,转录本的选择一般有两种思路,一种是一般认为每个基因在“NCBI Reference Sequences(RefSeq)”条目里显示的转录本1是研究最多的,可以从转录本编号后边的“.几”来判断该转录本更新的次数,更新的次数越多代表该转录本研究的越多;另一种则是选择众多mRNA转录本中最长的转录本(longest isoform)。

鼠标悬浮在第一个转录本上,会出现该转录本的详细信息,如Location:complement(7,668,421..7,687,490)、CDS length:1182 nt和Protein length:393 aa等。

您可以在页面上找到“Links & Tools”条目,点击“CCDS:CCDS11118.1”,进入相应的详细页面,找到“Nucleotide Sequence(1182 nt)即CDS序列”,找到“Translation(393 aa)即蛋白序列”。

另外,在基因相关信息页面,下拉找到“NCBI Reference Sequences(RefSeq)”条目,在“mRNA and Protein(s)”里可以看到有不同的转录本,其中mRNA一般是“NM”开头,非编码RNA一般以“NR”开头,还有一种“XM”开头是生物信息预测的转录本。“NP”开头表示蛋白质,“NC”开头表示基因。

找到想要的“NM”开头的转录本号和“NP”开头的蛋白号,点击进入,即可看到基因详细信息。

下滑找到“CDS”,点击,即可看到CDS序列,可以直接复制或者点击右下角“FASTA”再复制。

蛋白序列同理,下滑找到“Protein”,点击即可直接复制或者点击右下角“FASTA”再复制。

 

 四、如何查找启动子序列?

进入NCBI网站,选择“Gene”,在search框中输入感兴趣的基因的名称、基因ID或相关的生物物种,以“P53”为例。

点击“search”按钮,系统会显示与您的查询相关的数据库条目列表,选择对应的物种,以“human”为例。

向下翻动页面,找到“Genomic context”条目,此时注意查看基因的方向,P53基因方向为反向。

向下翻动页面,找到“Genomic regions, transcripts, and products”条目,点击FASTA。

进入基因序列详情页,在右侧“Selected region”选项中把from7668421to7687490改为from7687491to7689491(启动子序列一般默认为基因上游2000bp,由于P53基因方向为反向,NCBI默认的基因方向为正向,故选择在基因位置最大值上加2001,若基因方向为正向,则选择在基因位置最小值上减2001)。

点击“Update View”,所得序列即为P53基因启动子区域序列。

 五、如何查找基因的5'UTR3'UTR序列?

进入NCBI网站,选择“Gene”,在search框中输入感兴趣的基因的名称、基因ID或相关的生物物种,以“GAPDH”为例。

点击“search”按钮,系统会显示与您的查询相关的数据库条目列表,选择对应的物种,以“human”为例。

向下翻动页面,找到“Genomic regions, transcripts, and products”条目,点击“Tools”。

选择“Tools”中的“sequence text view”选项,点击后能看到基因的序列信息。

显示出来的结果应该怎么看?(这里标记的颜色是网站自动给出来的。)

蓝色标记序列代表的是5'UTR或3'UTR。红色标记序列代表的是外显子,因为外显子要翻译成氨基酸,所以下面会给出对应的氨基酸序列。绿色标记序列代表的是内含子,内含子不翻译,所以下面没有氨基酸序列。若没有显示出来完整的5'UTR或3'UTR,可以点左上角的“Prev page”或“Next page”。

因此,GAPDH这个基因的5'UTR序列如下:

GCTCTCTGCTCCTCCTGTTCGACAGTCAGCCGCATCTTCTTTTGCGTCGCCAG

3'UTR序列如下:

GACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCA

六、如何查找lncRNA序列?

进入NCBI网站,选择“Gene”,在search框中输入感兴趣的lncRNA名称、基因ID或相关的生物物种,以“MALAT1”为例。

点击“search”按钮,系统会显示与您的查询相关的数据库条目列表,选择对应的物种,以“human”为例。

向下翻动页面,找到“NCBI Reference Sequences(RefSeq)”条目,在“RNA”里可以看到有很多转录本,根据需求选择对应的转录本,一般推荐RefSeq Select(RefSeq的Select转录本通常有良好的存档数据支持,表达良好,保守,代表基因的生物学特性。)

向下翻动页面,找到“gene”条目点击,所得序列即为lncRNA“MALAT1”的序列。


http://www.hkcw.cn/article/pAJcVKdkyW.shtml

相关文章

PostgreSQL如何更新和删除表数据

这节说下怎样更新和删除表数据,当然认识命令了,可以问AI帮忙写。 接上节先看下天气表weather的数据,增加了杭州和西安的数据: 一.UPDATE更新命令 用UPDATE命令更新现有的行。 假设所有 杭州 5月12日的温度低了两度,用…

胖东来红内裤事件宣判:博主赔40万 名誉权纠纷落锤

2025年5月28日,许昌市魏都区人民法院公开审理了许昌市胖东来商贸集团有限公司与段某之间的名誉权纠纷案,并当庭宣判。法院判决段某在其个人抖音账号“两个小段(小)”发布书面道歉信的视频,且内容需经法院审核,发布后30日内不得删除;同时,段某需赔偿许昌市胖东来商贸集团…

一支烟能造成的危害远超你想象 !

一支烟能造成的危害远超你想象央视网原创解析。说到抽烟有什么坏处,哪怕是常年抽烟的人也能说出个一两句,但是真让抽烟者去戒烟,却是十分困难。为什么戒烟这么难?明明烟这么难闻,他们为什么爱抽烟?你以为在室外抽根烟,就不会影响家人健康了?大错特错!二手烟、三手烟的…

高铁站现“200寸巨型行李箱” 网友:这是要装下世界了?

近日,江西某地高铁站惊现一个“200寸巨型行李箱”,视频中能看到,两位女生合力才能推动这个巨型行李箱,还有热心的路人小哥上前帮忙,这个行李箱高度有近3米,和周围出站的行李箱形成鲜明对比,出站路人纷纷掏出手机拍照调侃:这集装箱进得去火车站吗?责任编辑:zx0002

普京会见安倍晋三遗孀 后者一度落泪 缅怀故人贡献

俄罗斯总统普京于5月29日在莫斯科会见了已故日本前首相安倍晋三的遗孀安倍昭惠。普京表达了对安倍晋三在俄日关系发展中所做贡献的认可,并向安倍昭惠赠送了一束鲜花。会谈中,安倍昭惠情绪激动,一度哽咽落泪。据媒体报道,在担任日本首相期间,安倍晋三与普京进行了多达27次面…

传输层协议TCP(上)

上一篇https://blog.csdn.net/Small_entreprene/article/details/148143494?fromshareblogdetail&sharetypeblogdetail&sharerId148143494&sharereferPC&sharesourceSmall_entreprene&sharefromfrom_link 上文学习了传输层的协议之一UDP,接下来…

Sqlyog-12数据库工具安装包和教程

1.引言 本次为大家介绍MySQL数据库可视化工具,sqlyog-12终极版64位和32位的安装教程 sqlyog安装包和终极版激活码在本文最后 2.安装 运行exe安装程序 软件语言选择简体中文 自定义软件安装位置 安装完成后需要输入激活码,我们输入安装包内提供的终极…

伊朗外长:伊方“并不确定”与美国接近达成协议

针对媒体当前有关伊朗与美国即将达成协议的猜测,伊朗外长阿拉格齐当地时间29日表示,伊方“并不确定是否已到这一步”。阿拉格齐当天在社交媒体上发文说,伊朗真诚地寻求一个符合各方利益的外交解决方案。但要实现这一目标,需要达成一项全面终止所有对伊制裁并维护伊朗核权利…

胡塞称一周内打击以色列多地目标:使用了14枚高超音速导弹、弹道导弹以及无人机

胡塞称一周内打击以色列多地目标。当地时间5月29日晚,也门胡塞武装领导人阿卜杜勒马利克胡塞在其每周讲话中表示,在本周内,该组织对以色列多地目标实施了军事打击。在打击过程中,该组织使用了14枚高超音速导弹、弹道导弹以及无人机,打击目标包括以色列特拉维夫以北的雅法、…

博主用AI杜撰霸王茶姬虚假信息被抓获 AI“洗稿”博流量

拼凑网络传言、利用AI“洗稿”,杜撰涉企不实文章,以此博流量、涨粉丝进而获取广告收益。5月29日,上海警方披露侦破一起利用人工智能技术编造、传播网络谣言损害企业权益案,抓获姚某、陈某等8名犯罪嫌疑人。年初,上海长宁警方接到辖区茶饮企业报案,称多个自媒体平台出现大…

中方代表为解决俄乌冲突提出三点建议

当地时间29日,联合国安理会举行乌克兰问题公开会,敦促俄乌立即全面停火,并呼吁国际社会加大人道援助。中方代表在发言中表示,乌克兰危机涉及的矛盾错综复杂,解决起来不可能一蹴而就。中方对此前的积极进展表示欢迎,支持一切通向和平的努力。中方为解决俄乌冲突提出了三点…

女子100米栏决赛:日媒报道田中佑美夺银未提吴艳妮

日媒报道田中佑美夺银未提吴艳妮。5月29日的韩国龟尾田径亚锦赛赛场,女子100米栏决赛上演了一场扣人心弦的较量。上届冠军的印度选手亚拉吉在后程突然发力,以12秒96(-0.1)的成绩成功卫冕,日本选手田中佑美以13秒061收获银牌,中国选手吴艳妮则以13秒068的成绩位列第三。这…

Blaster - Multiplayer P117-PXXX: 匹配状态

P118_ Game Timer 本局赛还剩多长时间. P118_1 Formet And Set Time Text ABlasterPlayerController::SetHUDMatchCountdown(). P118_2 计算剩余时间 我们目前在 PlayerController 做的倒计时逻辑, 之后会把其放到 Game Mode 中 , 这也许就是问题所在. P118_3 问题 各端的…

男子带不同小孩长期在地铁卖惨行乞,郑州地铁回应!

男子带不同小孩长期在地铁卖惨行乞。近日,多名网友曝光,一名五六十岁的中年男子长期在郑州地铁内以“给孩子治病”等各种理由向地铁内的乘客索要钱财,男子身边带的小孩还经常换人。纵览新闻记者联系到多位网友,他们证实曾出于爱心给过男子钱,之后多次发现男子还在行乞,并…

网红两个小段被判赔偿40万道歉30天 网络“黑嘴”敲响警钟

今年2月,一位名为“两个小段”的博主发布视频称,自己从胖东来购买的红色内裤掉色导致过敏。当时胖东来表示商品经检测合格,部分管理人员因处理不当被降级或免职,并给予顾客投诉奖和承担相关医疗费,同时追究该博主对胖东来造成的损失。2025年5月28日,许昌市魏都区人民法院…

光年号旅行中通信之选:英国sim卡使用指南

光年号旅行中通信之选:英国sim卡使用指南 在光年号这样的国际旅行工具广受欢迎的今天,英国sim卡成为旅客通信的首选。无论是导航、订票还是社交分享,英国sim卡都提供稳定服务。英国sim卡正是连接光年号与世界的重要纽带。 光年号为何需要英…

哪吒汽车回应上海总部logo连夜拆除 因场地到期即将搬家

哪吒汽车回应上海总部logo连夜拆除!哪吒汽车上海总部外墙的“哪吒汽车”字样LOGO被连夜拆除一事引起了关注。对此,哪吒汽车回应称,因场地到期,公司即将搬家。实际上,上个月租期就已结束,新的办公室地址尚未公布,但公司已经做好了准备。此前有媒体报道,三名工人在夜间通…

实验五 静态路由

一、实验目的 1)掌握静态路由配置方法; 2)启用路由器的路由功能; 3)查看路由表; 4)Ping和trace命令的使用; 二、实验环境 1)运行 Windows 2008 Server/XP/7 /10操作…

Unity Button 交互动画

在UGUI的Button组件中,有一个过渡动画表现的功能。可以对按钮的不同交互状态添加交互反馈动画,来提高玩家的交互体验。 交互状态 名称 描述 Normal 正常情况 Highlighted 高亮显示,例如鼠标触碰到按钮点击范围 Pressed 按钮被按下的时…

力扣HOT100之动态规划:70. 爬楼梯

这道题得用动态规划来做,用递归好像会超时。还是继续使用代码随想录中的动规五部曲: 1.确定dp[i]的含义:爬到第i阶楼梯的方法数 2.确定递推公式:dp[i] dp[i - 1] dp[i - 2] 3.dp数组初始化:dp[0] 1, dp[1] 1 4.确定遍历顺序:从前往后遍历…