2023年5月22日,Nature Communications杂志发表了中国科学院生物物理研究所朱平研究组题为"A method for restoring signals and revealing individual macromolecule states in cryo-ET, REST"的研究论文。在该论文中,研究者提出了一种基于深度学习策略,用于恢复冷冻电子断层成像(cryo electron tomography, Cryo-ET)中的缺失信息,并对冷冻电子断层三维重构结果中目标蛋白的原位结构特征及其动态变化进行高信噪比直接观察和识别的方法,命名为REST(REstoring the Signal in Tomograms)。
冷冻电子断层成像技术可以获得细胞及组织样品中纳米级分辨率的生物大分子原位三维结构,从研究尺度范围和结构解析分辨率两个方面为结构生物学和细胞生物学提供了很好的桥梁和补充。但是,目前这项技术仍然有很多局限性。首先,由于生物冷冻样品不耐受电子辐照损伤,而电子断层成像数据采集过程中需要对同一目标区域进行多角度的多次成像,只能采取低剂量成像模式。这种低剂量成像模式会导致所获得的电子断层图像具有极低的信噪比,为后续的图像处理,三维结构重构以及目标生物大分子识别带来了极大难度和挑战;其次,在电子断层成像数据采集过程中,由于样品台及成像过程的几何约束等限制,只能对样品在±60-70°倾转角度范围内采集图像。高角度倾转信息的缺失会导致样品在傅立叶空间中的信息不完整,从而产生电子断层图像中所谓的"缺失锥"现象,使电子断层三维重构图像产生分辨率各向异性(三维重构结果中样品Z轴方向的分辨率大大低于X-Y方向的分辨率)并形成严重的伪影。以上两点极大阻碍了研究者在冷冻电子断层三维重构结果中对感兴趣的目标分子及特征进行识别和处理。
近年来,深度学习技术在去噪、目标及特征识别等领域取得了重要进展。但由于冷冻电子断层成像中的极低信噪比和不可逆信息缺失,研究者难以获得深度学习过程中所需的目标颗粒真实信息(ground truth),使得利用神经网络和深度学习技术进行电子断层成像中的目标大分子蛋白识别具有很大的挑战。
针对深度学习训练过程中严重依赖训练数据集,但冷冻电子断层成像中难以获得应用于神经网络训练的"ground truth"问题,朱平研究组新发表的研究论文提出并实现了两种训练策略(图1)。在策略一中,研究者选取来自原始数据中少量颗粒进行亚单位平均 (sub-tomogram averaging, STA),以该平均结果作为训练的"ground truth"并和原始颗粒建立训练对。这种方法可以在原始数据和平均结果之间建立映射关系,并将基于少量原始颗粒信息获得的信息通过知识转移用于恢复更多的原始颗粒信息。在策略二中,研究人员通过对高质量"ground truth"密度图(如利用目标蛋白的原子结构产生三维密度图)人为添加不同程度的噪声和动态构象变化,以此模拟真实数据中低信噪比和大分子结构异质性,并将模拟获得的高噪声、动态变化的低质量颗粒密度图与高质量密度图(ground truth)建立映射和训练集。在建立以上训练集和深度学习策略后,研究者利用深度学习网络对训练集进行学习和训练,并将训练好的模型和学习到的知识迁移到原始数据中进行目标蛋白颗粒的信息恢复。
图. REST方法流程和训练策略
研究发现,采用以上策略,研究者可以利用REST方法在冷冻电镜三维重构结果中获得针对目标蛋白的信噪比提升1-2个数量级的高质量三维数据,极大提高了研究者识别感兴趣目标蛋白分子及特征的效率和准确度。有意思的是,研究者还发现,利用REST方法中的训练策略二,还可以获得目标蛋白未包含在训练集中的多种新构象状态,大大提高了在细胞原位结构中识别目标分子多态性结构的能力,对于具有动态构象变化的目标生物大分子原位结构变化的识别和可视化具有重要的意义。
总体而言,REST提供了一种可以在冷冻电子断层成像三维重构结果中对目标蛋白的三维结构和构象变化进行高信噪比直接可视化观察以及功能解释的新方法。该方法在恢复目标蛋白清晰信号(如在嘈杂的背景中识别并提取粒子)、分割目标特征、识别目标蛋白的动态或柔性结构、获得没有缺失信息的密度作为初始模型并辅助电子断层成像中亚单位平均(STA)等冷冻电子断层成像相关的各种任务中将具有广泛的应用价值和前景。
中科院生物物理研究所朱平研究组博士生张浩楠、副研究员李岩为该论文的共同第一作者,朱平研究员为论文的通讯作者。该研究工作得到国家自然科学基金、科技部重点研发项目、中国科学院战略性先导科技专项(B类)等的资助。
文章链接:
https://www.nature.com/articles/s41467-023-38539-w
(供稿:朱平研究组)
附件下载: