非编码RNA对生物分子的调控作用,一直是RNA功能研究的前沿。在以往的研究中,非编码RNA被发现可以和蛋白质、RNA以及基因组相互作用,调控复杂生物过程。比如经典的长非编码RNA Xist可以和X染色体相互作用并影响剂量补偿效应。理解非编码RNA和生物分子的相互作用对于研究非编码RNA的功能以及生物分子调控网络的构建是非常重要的。
2019年10月31日,Nucleic Acids Research在线发表了中科院生物物理所健康大数据研究中心题目为“NPInter v4.0: An integrated database of ncRNA interactions”的论文,发布了最新版的NPInter(NPInter v4.0)。该数据库系统地收录了绝大多数种类非编码RNA的相互作用,并对相互作用以及相关分子进行了详细的注释以及可视化,提供了一个全面、系统的非编码RNA相互作用的研究平台。
陈润生院士课题组于2006年发布了NPInter数据库的第一个版本(Nucleic Acids Research),在过去的十多年中,该数据库一直获得业内的广泛认可,被RNAcentral收录为专家数据库。迄今为止,已经更新过三个版本。此次的v4.0更新,整合了近几年来发表的非编码RNA相互作用文献以及高通量RNA相互作用测序数据,环状RNA(circRNA)的相互作用和ChIRP-seq获得的非编码RNA-基因组的相互作用首次被收录进来。总数据量上升到11万条,涵盖了35个物种。相互作用以及作用分子还增加了疾病注释,旨在帮助研究者更好地理解相互作用的功能。除了整合数据之外,整个数据库的网站也进行了重新构建,提高了原有搜索模块的易用性,并增加了很多新的功能性模块如biocircos.js。网站收录整理了大量具有特定功能的基因集合,并提供了基于这些基因集合的个性化搜索。所有的相互作用数据都可以在(http://bigdata.ibp.ac.cn/npinter4/download/)进行下载。
NPInter的此次更新工作主要由中国科学院生物物理研究所健康大数据研究中心(http://bigdata.ibp.ac.cn)完成。该研究中心于2015年5月成立,陈润生院士任中心主任,何顺民研究员任中心常务副主任。中心主要针对生物组学大数据进行整合挖掘分析研究,并辅以开发组学研究分析的新技术,力求打造围绕国家精准医学和重要战略生物资源的组学数据存储、应用和共享的公共技术支撑体系。经过近四年多的运行,中心发展迅速,已完成测序平台、计算集群和数据存储平台、多组学生命数据分析平台和数据共享平台的建设。
中国科学院生物物理研究所陈润生院士、何顺民研究员以及中国科学院计算技术研究所赵屹研究员为本文共同通讯作者。中国科学院生物物理研究所健康大数据研究中心滕学奕、陈晓敏和薛花为本文并列第一作者。该文章获得国家自然科学基金[31701117, 31970647],国家重点研发项目[2016YFC0901702, 2017YFC0907503]的资助。
文章链接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkz969/5610361?searchresult=1
(供稿:陈润生研究组)
附件下载: