中国科学院生物物理研究所,表观遗传调控与干预重点实验室,研究组长 健康大数据研究中心,常务副主任 中国科学院大学生命科学学院,教授
1997 - 2001 南京理工大学,电子工程专业,学士
2001 - 2004 北京NEC电子有限公司,软件工程师
2004 - 2009 中国科学院生物物理研究所,生物信息学,硕博连读
导师:陈润生院士;毕业论文:非编码RNA的功能研究——从转录组到相互作用网络。
2010-2011 哈佛大学Dana-farber癌症研究所 & 哈佛大学公共卫生学院生物统计系,博士后;研究方向:癌症和表观遗传学;合作教授:Xiaole Shirley Liu教授。
研究方向:癌症和表观遗传学
2016.4 - 2016.7 美国加州大学圣地亚哥分校,细胞与分子医学系,访问学者;合作教授:付向东教授。
2009 - 2017 中国科学院动物研究所,先后担任副研究员,创新研究员岗位。研究方向:生物信息学、组学大数据整合分析和精准医学。
2017.5 - 至今 中国科学院生物物理研究所,研究员;健康大数据研究中心,常务副主任;中国科学院大学生命科学学院,教授。
1. 大规模人群队列的全基因组和多组学研究
围绕"女娲"中国人群基因组资源,第一阶段包含5000多例中国参考人群样本、超30X全基因组高深度测序数据,是已发表的高深度测序中国参考人群全基因组队列。"女娲"基因组资源致力于构建并解析中国人群遗传变异图谱;开发基因组数据分析和变异解读算法和数据库(如变异鉴定解析、关联分析方法论等);聚焦疾病队列研究、重大疾病的关联分析和精准医学研究。目前已经开展多项疾病队列的全基因组测序分析工作,相关成果正在整理当中。。
目前进展:A)2021年首次发布中国人群SNP/Indel变异图谱和首个中国人群特异的大规模单倍型参考面板 (Cell Reports, 2021),其中2500万变异为国际首次发现,被认为是对中国人群基因组数据分析最全面深入的研究。相关报道:徐涛/何顺民团队发布"女娲"基因组资源,提供中国人群遗传变异图谱和参考面板。B)2022年系统分析和挖掘了5675人的全基因组数据,发布全球人群移动元件变异图谱 (Nucleic Acids Research, 2022),鉴定了3.6万变异,其中2/3为首次发现,是含中国人群数目最多的移动元件变异资源。相关报道:"女娲"基因组计划第2篇|徐涛/何顺民团队发布中国人群可移动元件插入变异图谱。C)2023年系统分析和挖掘了6487人的全基因组数据,发布全球人群的微卫星(短串联重复)序列变异图谱 (Nature Communications, 2023),鉴定了超过156万变异,其中1/3为首次发现,是含中国人群数目最多的微卫星变异资源。相关报道:"女娲"基因组资源发布第三项成果:解析中国人群基因组微卫星变异图谱。D)2023年系统解析汉族人群基因组的近期正选择信号,发现一系列生理病理表型的受选择基因,扩展对自然演化和表型适应的理解(Science Bulletin, 2023)。相关报道:“女娲”基因组资源发布中国汉族人群基因组近期适应性选择的最新发现。E)2024年系统解析汉族人群基因组非编码调控元件的适应性选择及其对表型/疾病演化影响,阐明转录调控水平的适应性进化(Molecular Biology and Evolution, 2024)。相关报道:“女娲”基因组第五篇| 徐涛/何顺民团队揭示中国人群基因组非编码调控元件的适应性选择。
2. 非编码基因的系统鉴定、功能解析、相互作用和变异解读
人类基因组中97%左右的区域是非编码区域,大约80%的DNA序列能转录产生各种非编码RNA。非编码RNA种类繁多,功能各异,系统的鉴定非编码RNA和调控元件,解析非编码RNA的相互作用和功能,对非编码区变异进行注释和解读,一直以来都是非编码研究领域的核心和重点。
目前进展:a)聚焦复杂非编码区域功能解析,开发并维护着国际权威的非编码功能注释和解读知识库:聚焦长链非编码RNA的NONCODE数据库 (Nucleic Acids Res. 2020. DOI: https://doi.org/10.1093/nar/gkaa1046),聚焦piRNA的piRBase数据库 (Nucleic Acids Res. 2021. DOI: https://doi.org/10.1093/nar/gkab1012)和聚焦小蛋白的SmProt数据库 (GPB. 2021. DOI: https://doi.org/10.1016/j.gpb.2021.09.002)等;b) 围绕非编码RNA功能解析方面,开发了重复序列来源非编码RNA和染色质互作的系统分析方法,并首次发现一类重复序列来源的新型非编码RNA对维持异染色质功能的至关重要(Genome Research. 2020. DOI: https://doi.org/10.1101/gr.256131.119),聚焦RNA-DNA、RNA-RNA和RNA-Protein相互作用,开发NPInter功能解析数据库(Nucleic Acids Res. 2023. DOI: https://doi.org/10.1093/nar/gkac1002)。
3. 疾病相关的单细胞和多组学研究
基于单细胞多组学的肿瘤发生、发展、转移和临床应用研究。目前这方面的工作正在进展中。
(# 第一/并列第一作者, * 通讯/共同通讯作者)
1. Shuai Liu#, Huaxia Luo#, Peng Zhang, Yanyan Li, Di Hao, Sijia Zhang, Tingrui Song, Tao Xu*, Shunmin He*. (2024). Adaptive Selection of Cis-regulatory Elements in the Han Chinese. Mol. Biol. Evol.
DOI: https://doi.org/10.1093/molbev/msae034
2. Huaxia Luo#, Peng Zhang#, Wanyu Zhang, Yu Zheng, Di Hao, Yirong Shi, Yiwei Niu, Tingrui Song, Yanyan Li, Shilei Zhao, Hua Chen*, Tao Xu*, Shunmin He*. (2023). Recent positive selection signatures reveal phenotypic evolution in the Han Chinese population. Science Bulletin.
DOI: https://doi.org/10.1016/j.scib.2023.08.027
3. Honghong Zhou#, Xinpei Hao#, Peng Zhang, Shunmin He*. (2023). Noncoding RNA mutations in cancer. Wiley Interdisciplinary Reviews: RNA.
DOI: https://doi.org/10.1002/wrna.1812
4. Yirong Shi#, Yiwei Niu#, Peng Zhang, Huaxia Luo, Shuai Liu, Sijia Zhang, Jiajia Wang, Yanyan Li, Xinyue Liu, Tingrui Song, Tao Xu*, Shunmin He*. (2023). Characterization of genome-wide STR variation in 6,487 human genomes. Nature Communication.
DOI: https://doi.org/10.1038/s41467-023-37690-8
5. Yu Zheng#, Huaxia Luo#, Xueyi Teng#, Xinpei Hao, Xiaoyu Yan, Yiheng Tang, Wanyu Zhang, Yuanxin Wang, Peng Zhang, Yanyan Li, Yi Zhao, Runsheng Chen*, Shunmin He*. (2023). NPInter v5.0: ncRNA interaction database in a new era. Nucleic Acids Res.
DOI: https://doi.org/10.1093/nar/gkac1002
6. Yiwei Niu#, Xueyi Teng#, Honghong Zhou#, Yirong Shi, Yanyan Li, Yiheng Tang, Peng Zhang, Huaxia Luo, Quan Kang, Tao Xu*, Shunmin He*. (2022). Characterizing mobile element insertions in 5675 genomes. Nucleic Acids Res.
DOI: https://doi.org/10.1093/nar/gkac128
7. Peng Zhang#, Huaxia Luo#, Yanyan Li#, You Wang#, Jiajia Wang#, Yu Zheng#, Yiwei Niu, Yirong Shi, Honghong Zhou, Tingrui Song, Quan Kang, Han100K Initiative; Tao Xu*, Shunmin He*.(2021). NyuWa Genome resource: A deep whole-genome sequencing-based variation profile and reference panel for the Chinese population. Cell Rep 37, 110017.
DOI: https://doi.org/10.1016/j.celrep.2021.110017
8. Jiajia Wang#, Yirong Shi#, Honghong Zhou#, Peng Zhang, Tingrui Song, Zhiye Ying, Haopeng Yu, Yanyan Li, Yi Zhao , Xiaoxi Zeng*, Shunmin He*, Runsheng Chen*.(2021). piRBase: integrating piRNA annotation in all aspects. Nucleic Acids Res.
DOI: https://doi.org/10.1093/nar/gkab1012
9. Yanyan Li#, Honghong Zhou#, Xiaomin Chen#, Yu Zheng, Quan Kang, Di Hao, Lili Zhang, Tingrui Song, Huaxia Luo, Yajing Hao, Runsheng Chen*, Peng Zhang*, Shunmin He*.(2021). SmProt: A Reliable Repository with Comprehensive Annotation of Small Proteins Identified from Ribosome Profiling. Genomics Proteomics Bioinformatics.
DOI: https://doi.org/10.1016/j.gpb.2021.09.002
10. Ruibao Su#, Li-Hua Fan#, Changchang Cao#, Lei Wang, Zongchang Du, Zhaokui Cai, Ying-Chun Ouyang, Yue Wang , Qian Zhou, Ligang Wu, Nan Zhang, Xiaoxiao Zhu, Wen-Long Lei, Hailian Zhao, Yong Tian, Shunmin He, Catherine C L Wong*, Qing-Yuan Sun*, Yuanchao Xue*.(2021). Global profiling of RNA-binding protein target sites by LACE-seq. Nat Cell Biol 23, 664-675.
DOI: https://doi.org/10.1038/s41556-021-00696-9
11. CNCB-NGDC Members and Partners. (2021). Database Resources of the National Genomics Data Center, China National Center for Bioinformation in 2022. Nucleic Acids Res.
DOI: https://doi.org/10.1093/nar/gkab951
12. Yajing Hao#, Dongpeng Wang#, Shuheng Wu, Xiao Li, Changwei Shao, Peng Zhang, Jia-Yu Chen, Do-Hwan Lim, Xiang-Dong Fu*, Runsheng Chen*, Shunmin He*. (2020). Active retrotransposons help maintain pericentromeric heterochromatin required for faithful cell division. Genome Research.
DOI: https://doi.org/10.1101/gr.256131.119
13. Lianhe Zhao#, Jiajia Wang#, Yanyan Li#,, Tingrui Song, Yang Wu, Shuangsang Fang, Dechao Bu, Hui Li, Liang Sun, Dong Pei, Yu Zheng, Jianqin Huang, Mingqing Xu, Runsheng Chen*, Yi Zhao*, Shunmin He*. (2020). NONCODEV6: an updated database dedicated to long non-coding RNA annotation in both animals and plants. Nucleic Acids Res.
DOI: https://doi.org/10.1093/nar/gkaa1046
14. Zhaokui Cai#, Changchang Cao#, Lei Ji#, Rong Ye, Di Wang, Cong Xia, Sui Wang, Zongchang Du, Naijing Hu, Xiaohua Yu, Juan Chen, Lei Wang, Xianguang Yang, Shunmin He, Yuanchao Xue*. (2020). RIC-seq for global in situ profiling of RNA-RNA spatial interactions. Nature.
DOI: https://doi.org/10.1038/s41586-020-2249-1
15. Xueye Teng#, Xiaomin Chen#, Hua Xue#, Yiheng Tang, Peng Zhang, Quan Kang, Yajing Hao, Runsheng Chen*, Yi Zhao*, Shunmin He*. (2020). NPInter v4.0: An integrated database of ncRNA interactions. Nucleic Acids Res.
DOI: https://doi.org/10.1093/nar/gkz969
16. Shunmin He#, Guoqiang Zhang#, Jiajia Wang#, Yaji Gao#, Ruidi sun, Zhijie Cao, Zhenping Chen, Xiudeng Zheng, Jiao Yuan, Yuewan Luo, Xiaona Wang, Wenxin Zhang, Peng Zhang, Yi Zhao, Chuan He, Yi Tao*, Qinmiao Sun*, Dahua Chen*. (2019). 6mA-DNA-binding factor Jumu controls maternal-to-zygotic transition upstream of Zelda. Nature Communication. 10(1). 2219.
DOI: https://doi.org/10.1038/s41467-019-10202-3
17. The RNAcentral Consortium. (2019). RNAcentral: a hub of information for non-coding RNA sequences. Nucleic Acids Res.
DOI: https://doi.org/10.1093/nar/gky1034
18. Jiajia Wang#, Peng Zhang#, Yiping Lu#, Yanyan Li, Yu Zheng, Yunchao Kan, Runsheng Chen*, Shunmin He*. (2019). piRBase: a comprehensive database of piRNA sequences. Nucleic Acids Res.
DOI: https://doi.org/10.1093/nar/gky1043
19. Liang Chen#, Jia-Yu Chen#, Yi-Jou Huang#, Ying Gu, Jinsong Qiu, Hao Qian, Changwei Shao, Xuan Zhang, Jing Hu, Hairi Li, Shunmin He, Yu Zhou, Omar Abdel-Wahab, Dong-Er Zhang*, Xiang-Dong Fu*. (2018). The Augmented R-Loop Is a Unifying Mechanism for Myelodysplastic Syndromes Induced by High-Risk Splicing Factor Mutations. Molecular Cell. 69(3), 412-425
DOI: https://doi.org/10.1016/j.molcel.2017.12.029
(资料来源:何顺民研究员,2024-09-12)