在人类基因组中,超过一半的区域由重复序列组成。这些重复序列在人类进化过程中高度变化,极大地丰富了基因组的遗传多样性。可变数目串联重复序列(variable number tandem repeats,VNTRs),又被称为"小卫星DNA",是一类重复基序(motif)超过6 bp(base pair),重复次数通常在10-60次的DNA串联序列。已有研究表明VNTR不仅可以通过长度扩增来增加患病风险,其重复基序(motif)的变化也具备独立的致病效应。然而受限于样本量、测序深度、人群多样性及识别算法等因素,在已有的人群规模的基因组测序项目中,VNTR的遗传研究还远远不足,导致了人类基因组中部分遗传力的"缺失"。
中国科学院生物物理研究所徐涛院士团队和何顺民研究员团队近日在《Cell Genomics》上发表题为"Genome-wide Investigation of VNTR Motif Polymorphisms in 8,222 Genomes: Implications for Biological Regulation and Human Traits"的文章(图1)。利用140多个国家和地区的8,222例高深度全基因组测序数据,构建了全球人群VNTR多态性遗传图谱("女娲"VNTR多态性图谱),系统解析了VNTR的功能特征,特别是其在基因表达中的调控作用。
图1. 文章概要
此前"女娲"基因组项目基于大规模人群全基因组测序数据,已经发布和解析了人类基因组SNP、InDel变异图谱(Cell Reports, 2021),移动元件变异图谱(MEI, Nucleic Acids Research, 2022) 和微卫星变异图谱(STR, Nature Communications, 2023),并基于基因组中的近期正选择(Science Bulletin, 2023)及非编码调控元件适应性选择(Molecular Biology and Evolution,2024),探讨了其对人类表型和疾病演化的影响。
此次发布的"女娲"VNTR多态性图谱,完成了"女娲"基因组资源对人类基因组中主要重复序列元件的全覆盖(ME,STR和VNTR),是系统解析重复序列元件变异的重要参考。该工作拓展了现有遗传研究中重复序列元件变异规模,为我们理解重复序列元件在基因调控中的作用提供了新的视角,并为未来的临床研究和基因型-表型关联研究提供了重要参考。
中国科学院大学生命科学学院博士生张斯佳和中国科学院生物物理研究所博士生宋乔为该论文的共同第一作者,中国科学院生物物理研究所徐涛院士、何顺民研究员为论文的共同通讯作者。何顺民研究组的张鹏、王晓娜、郭榕、李燕燕、刘帅、颜晓钰、张晶晶、牛仪伟、史忆戎和宋廷瑞等也参与了该项研究工作。SPR等实验工作得到中国科学院生物物理研究所蛋白质科学研究平台相关工作人员陈媛媛、杨真威、周冰雪的帮助和支持。EMSA实验工作得到中国科学院生物物理研究所朱冰研究组马润泽的技术支持。该研究工作得到了中国科学院战略性先导科技专项、国家重点研发计划、中国科学院“十四五”信息化规划、国家自然科学基金、中国博士后科学基金、国家基因组科学数据中心等多个项目的支持。
文章链接:https://www.cell.com/cell-genomics/fulltext/S2666-979X(24)00328-8
(供稿:徐涛/何顺民团队)