这篇题为《完全组装的酿酒酵母剪接体激活前结构》(Structures of the Fully Assembled Saccharomyces cerevisiae Spliceosome Before Activation)的论文报道了酿酒酵母剪接体处于被激活前阶段的两个完全组装的关键构象——预催化剪接体前体(precursor pre-catalytic spliceosome,定义为“pre-B复合物”)和预催化剪接体(pre-catalytic spliceosome,定义为“B复合物”)。这两个整体分辨率分别为3.3-4.6埃和3.9埃的高分辨率三维结构首次展示了在剪接体组装过程中pre-mRNA的5’剪接位点和分支点(BPS)的识别状态与动态变化,回答了剪接体激活前pre-mRNA的5’剪接位点和分支点识别机理,以及激活过程中5’剪接位点和分支点如何逐步进入活性位点、剪接体如何逐步组装并通过结构重组最终完成激活等重要问题。
RNA剪接是真核生物基因表达调控的重要环节之一。上世纪70年代,科学家们首次发现真核生物基因的不连续性,从而表明遗传信息从DNA转移到RNA上之后,需要经历有效遗传信息的“剪断”与重新“拼接”,这种有效遗传信息的拼接与“无效”遗传信息的去除,被称为RNA剪接。RNA剪接普遍存在于真核生物中,随着物种的进化,含有内含子的基因数量增加,发生RNA剪接的频率也相应增高,使得一个基因编码多个蛋白质成为可能。RNA剪接的本质是两步转酯反应,这种看似简单的化学反应在细胞中难以自行发生,而负责执行这一化学反应的是细胞核内一个巨大且高度动态变化的分子机器——剪接体(spliceosome)。在剪接反应过程中,多种蛋白质-核酸复合物及剪接因子按照高度精确的顺序发生结合和解聚,依次形成预组装复合物U4/U6.U5 Tri-snRNP(U4/U6.U5三小核核糖核蛋白复合物)以及至少8个状态的剪接体pre-B、B、Bact、B*、C、C*、P以及ILS复合物。
由于剪接体高度的动态性和复杂性,获得不同状态的剪接体的高分辨率三维结构被公认为世界难题。在这种巨大的挑战下,
教授率领研究组迎难而上,经过7年的努力,终于在2015年首次报道了裂殖酵母剪接体3.6埃的高分辨率结构,首次展示了剪接体催化中心近原子分辨率的结构。这一重大研究成果对RNA剪接机理的研究产生革命性影响。自2015年第一个剪接体结构发表以后,施一公研究组相继解析了酿酒酵母剪接体复合物处于6个不同状态的高分辨率结构,分别是3.8埃的预组装复合物U4/U6.U5 Tri-snRNP、3.5埃的激活状态复合物Bact complex、3.4埃的第一步催化反应后复合物C complex、4.0埃的第二步催化激活状态下的C* complex、3.6埃的完成两步转酯反应后状态下的P complex,以及3.5埃的内含子套索剪接体ILS complex的结构。这些已解析的剪接体基本覆盖了整个RNA剪接循环,从分子层面揭示了剪接体催化RNA剪接两步反应的工作机理,同时为理解剪接体的激活和解聚等过程的发生提供依据。然而,想要清楚解释剪接体是如何逐步组装并完成激活的机制仍有困难,而最新发表的这篇文章所解析的两个关键状态的剪接体,则弥补了领域内对这一部分研究的缺陷。本文报道的处于激活前的两个完全组装的剪接体结构,从复合物的提纯、样品的制备到结构的解析,每一步都十分具有挑战。预催化剪接体前体(pre-B complex)由U1 snRNP、U2 snRNP以及U4/U6.U5 tri-snRNP组成,目前被认为是组成蛋白最多、分子量最大的剪接体,该状态结构复杂,但各组分之间的相互作用并不紧密,使得该复合物在提纯过程中十分容易解聚。在最新发表的这篇《科学》文章中,施一公研究组对提纯方案多次探索,最终优化出一套可以获得稳定的、性质良好的pre-B complex样品。随后利用单颗粒
技术重构出了U1 snRNP、U2 snRNP以及U4/U6.U5 tri-snRNP部分分辨率高达3.3埃、3.6-4.6埃以及3.4埃的冷冻电镜结构,并搭建了原子模型。该文解析的pre-B complex结构是目前世界上已解析的唯一一个同时包含五种核糖核蛋白(snRNP)剪接体结构,它由68个蛋白和6条RNA组成。在该结构中,首次观察到了剪接体组装早期U1 snRNP对5’剪接位点的识别,以及五种核糖核蛋白之间的相互作用界面。与此同时,该文还报道了处于pre-B complex之后的另一个完全组装的剪接体,即预催化剪接体B complex的高分辨率三维结构。结合B complex的结构信息,通过结构对比,可以清楚的看到在组装过程中,pre-mRNA的5’剪接位点由一开始被U1 snRNP识别,而后由于构象变化被转移并与U6 snRNA配对,这一步的变化为剪接体激活提供了结构基础。除此之外,分支点的动态变化、剪接体的各组分所经历的结构重组与构象改变也都清晰的呈现出来。在文章最后,根据pre-B的结构特征,作者还大胆推测了最早期的不完全组装的预剪接体(pre-spliceosome,定义为“A 复合物”)的三维结构模型(图2)。这两个关键状态剪接体结构的解析,为揭示剪接体组装初期如何识别5’剪接位点和分支点、如何进行结构重组以及如何完成剪接体的激活等问题的机理提供了最直接、有效的结构证据,也将为更高等真核生物可变剪接的研究提供结构基础与理论依据。
截至目前为止,施一公研究组在酵母中一共解析了9个不同状态的剪接体高分辨的三维结构(图3),从组装到被激活,从发生两步转酯反应到剪接体的解聚,这9个状态的剪接体完整覆盖了剪接通路,首次将剪接体介导RNA剪接的过程串联起来,为理解RNA剪接的分子机理提供了最清晰、最全面的结构信息。
清华大学生命科学学院、结构生物学高精尖创新中心施一公教授为本文的通讯作者;清华大学生命科学学院三年级博士研究生白蕊,医学院博士后、结构生物学高精尖创新中心卓越学者万蕊雪以及生命科学学院博士后、结构生物学高精尖创新中心卓越学者闫创业为该文的共同第一作者;清华大学冷冻电镜平台的雷建林博士为冷冻电镜数据收集提供了帮助。电镜数据采集于清华大学冷冻电镜平台,计算工作得到清华大学高性能计算平台、国家蛋白质设施实验技术中心(北京)的支持。本工作获得了北京市结构生物学高精尖创新中心及国家自然科学基金委的经费支持。