Reviews and Monographs综述与专论 回场回 D)】生物化学与生物物理进展 202 (:1273129 in Bic and Biophysics www.pibb.ac.cn 核磁共振波谱法在蛋白质三维结构 解析中的应用 尹林申峻丞杨立群” (中山大学化学学院,聚合物复合材料及功能材料教育有部重点实验室,广东省高性能树脂基复合材料重点实验室,广州51025) 摘要蛋白质特定的三维结构与其生物功能密切相关,因此,研究蛋白质的三维结构有助于揭示其生物功能机制。将核础 共振(NMR)波谱法应用于研究溶液状态下蛋白质的三维结构,能够更加准确地揭示蛋白质结构与生物功能之间的关系。 本文综述了NMR解析蛋白质三维结构的理论和技术方法,以及NMR结合其他生物物理手段,并铺以分子建模计算法研究 蛋白质三维结构的研究进展和最新方法,为精准解析蛋白质的三维结构提供思路及策略。 关键词核磁共振波谱法,蛋白质三维结构,同位素标记蛋白质,结构约束,蛋白质分子激发态结构。超大蛋白质复合体 的三维结构 中图分类号Q5,Q6.Q7 D0L:10.16476.pibb.2021.0065 每一种蛋白质都有自己特殊的空间结构,被称 难题而限制其在蛋白质三维结构研究中的应用:第 为三维结构或空间构象。蛋白质作为一种重要的生 一,随着蛋白质的氨基酸数目和分子质量的增加 物大分子,参与进行大多数生命活动(如酶催化代 造成NMR共振信号峰严重重叠:第二,横向弛豫 谢、免疫调节、细胞信息传递、载体运输以及能量 速率(R)的加快,致使NMR信号峰增宽和分辨 供应等),所以,研究蛋白质的三维结构对揭示其 率变差。因此,本文主要概述NMR解析蛋白质三 生物功能至关重要。这些理论有助于更深层次认识 维结构的理论和技术方法,以及NMR结合其他生 蛋白质在健康生理活动和疾病产生过程中发挥的作 物物理手段,并辅以分子建模计算法研究蛋白质三 用和机制,也将促进相关疾病的临床诊治和药物 维结构的研究进展和最新方法,为精准解析蛋白质 设计。 的三维结构提供思路及策略。 尽管X射线衍射法已被广泛用于解析蛋白质三 维结构,然而,该方法仍然存在一些缺陷,例如X 1核磁共振波谱法解析蛋白质三维结构的 射线衍射法只能用于研究蛋白质晶体的静态结构, 理论概述 并且一些蛋白质因结构的无序性而难以形成晶体 自旋量子数不为零的原子核(主要为H、℃、 (或形成的晶体存在缺陷而不足以X射线衍射法研 N、℉和P等),它们在外加静磁场中自旋运动 究)。相比之下,核磁共振(nuclear magnetic 时存在着不同的能级,相邻两能级间的能量差 resonance,.NMR)波谱法更适合用于研究溶液状 (△E)为: 态下蛋白质的三维结构,能够更加准确地揭示蛋白 △E=hH (1) 质结构与生物功能之间的自然规律口。 式中,y为磁旋比,=h2π(h为普朗克常数),。 2DNMR技术已广泛用于解析较小分子质量 (≤10ku)蛋白质的三维结构。虽然3D和4D *广东省自然科学基金(2017B030311007)资助项目。 率通讯联系人。 NMR技术逐渐被用于解析分子质量较高的蛋白质 Tel:020-39339796.E-mail:vanglg @mail.sysu.edu cn 的三维结构,但是,NMR测试技术仍然面临两大 收稿日期:2021-08-31,接受日期:2021-10-12
Reviews and Monographs 综述与专论 生物化学与生物物理进展 Progress in Biochemistry and Biophysics 2022,49(7):1273~1290 www.pibb.ac.cn 核磁共振波谱法在蛋白质三维结构 解析中的应用* 尹 林 申峻丞 杨立群** (中山大学化学学院,聚合物复合材料及功能材料教育部重点实验室,广东省高性能树脂基复合材料重点实验室,广州 510275) 摘要 蛋白质特定的三维结构与其生物功能密切相关,因此,研究蛋白质的三维结构有助于揭示其生物功能机制。将核磁 共振 (NMR) 波谱法应用于研究溶液状态下蛋白质的三维结构,能够更加准确地揭示蛋白质结构与生物功能之间的关系。 本文综述了NMR解析蛋白质三维结构的理论和技术方法,以及NMR结合其他生物物理手段,并辅以分子建模计算法研究 蛋白质三维结构的研究进展和最新方法,为精准解析蛋白质的三维结构提供思路及策略。 关键词 核磁共振波谱法,蛋白质三维结构,同位素标记蛋白质,结构约束,蛋白质分子激发态结构,超大蛋白质复合体 的三维结构 中图分类号 Q5,Q6,Q7 DOI:10.16476/j.pibb.2021.0065 每一种蛋白质都有自己特殊的空间结构,被称 为三维结构或空间构象。蛋白质作为一种重要的生 物大分子,参与进行大多数生命活动(如酶催化代 谢、免疫调节、细胞信息传递、载体运输以及能量 供应等),所以,研究蛋白质的三维结构对揭示其 生物功能至关重要。这些理论有助于更深层次认识 蛋白质在健康生理活动和疾病产生过程中发挥的作 用和机制,也将促进相关疾病的临床诊治和药物 设计。 尽管X射线衍射法已被广泛用于解析蛋白质三 维结构,然而,该方法仍然存在一些缺陷,例如X 射线衍射法只能用于研究蛋白质晶体的静态结构, 并且一些蛋白质因结构的无序性而难以形成晶体 (或形成的晶体存在缺陷而不足以X射线衍射法研 究)。 相 比 之 下 , 核 磁 共 振 (nuclear magnetic resonance,NMR) 波谱法更适合用于研究溶液状 态下蛋白质的三维结构,能够更加准确地揭示蛋白 质结构与生物功能之间的自然规律[1] 。 2D NMR 技术已广泛用于解析较小分子质量 (≤10 ku) 蛋白质的三维结构[2]。虽然 3D 和 4D NMR技术逐渐被用于解析分子质量较高的蛋白质 的三维结构,但是,NMR测试技术仍然面临两大 难题而限制其在蛋白质三维结构研究中的应用:第 一,随着蛋白质的氨基酸数目和分子质量的增加, 造成NMR共振信号峰严重重叠;第二,横向弛豫 速率 (R2 ) 的加快,致使NMR信号峰增宽和分辨 率变差。因此,本文主要概述NMR解析蛋白质三 维结构的理论和技术方法,以及NMR结合其他生 物物理手段,并辅以分子建模计算法研究蛋白质三 维结构的研究进展和最新方法,为精准解析蛋白质 的三维结构提供思路及策略。 1 核磁共振波谱法解析蛋白质三维结构的 理论概述 自旋量子数不为零的原子核(主要为1 H、13C、 15N、19F和13P等),它们在外加静磁场中自旋运动 时存在着不同的能级,相邻两能级间的能量差 (ΔE)为: ΔE = γℏH0 (1) 式中,γ为磁旋比,ℏ=h/2π (h为普朗克常数),H0 ∗ 广东省自然科学基金(2017B030311007)资助项目。 ∗∗ 通讯联系人。 Tel:020-39339796,E-mail:yanglq@mail.sysu.edu.cn 收稿日期:2021‑08‑31,接受日期:2021‑10‑12
1274 生物化学与生物物理进展Prog.Biochem.Biophys. 2022:49(7) 为静磁场强度」 HNCACO、HNCOCA、HNCO.,CA等l。根据 在外加静磁场中。原子核绕其自旋轴旋转。自 NMR软件结合NMR技术所获得的H、N」 旋轴与静磁场保持某一夹角而围绕静磁场方向讲动 1C0、C和1C化学位移、摆合常数和质子间距 的频率(为 离,推算蛋白质主链中氨基酸的序列及其二面角结 ) 构参数 ,得出蛋白质的二级结构。通过测定NOP 当用频率为仙,的射频照射静磁场中自旋运动 顺磁弛豫增强 paramagnetic relaxation 的原子核时,原子核才能有效地吸收射频辆射的能 enhancement.PRE)以及残余偶极揭合(residua 量,从低能级跃汗至高能级,实即核磁共振。所 dipolar coupling,RDC)等NMR参数获得蛋白质 以,核磁共振波谱来源于原子核能级间的跃迁,即 的三维结构约束参数(包括原子间空间距离、化学 键空间取向等),进一步结合NMR计算软件解析 的原子核发生共振跃迁 录发生 核破 蛋白质的 维结构 时的信号蜂位置和强度,得到核磁共振波谱,其 以常用的3DN/CH三共振HNCA和 振信号反映了官能团和构象等分子结构信息。通常 HN(CO)CA NMR为例,蛋白质分子中的氨基酸通 将日、C和N原子核的磁共根技术应用于蛋白质 过磁化矢量传递(图1b①)。HNCA可测定同一个 的结构解析,例如桶讨NR实验获得化学位移 氨基酸内的H和N原子与C原子的关联(以第 她豫时间、耦合常数、核奥弗泽效应( 个氨基酸为例),以及第个氨基酸的H产和N原 用于研究蛋 子与第 质的三维站构及其分子动力学等 1个氨基酸C原子的关联;HN(CO)C 通常只提供同一个氨基酸内的F和N原子与邻 NMR解析蛋白质三维结构的流程图如图1a所 近氨基酸C原子之间的关联信息。在蛋白质样品 示。为了避免蛋白质共振信号峰的重叠,提高其分 3DNMR谱图中(图1b②),诵过上术关联信息解 讲率,一般需要制备N、C或H标记的蛋白质 析蛋白质主链中氨基酸的序列结构(图1b③),根 采用5NCH三共振多维核磁技术采集堂验数据 据质子间压离和一面角结物参数(图1④)。并第 对共振信号进行分析、筛选及归属 主要相关的 用化学位移预测法解析二级结构 。结合结构约束 NMR技术包括HNCA、HN(CO)CA,HNCC 数,通过NMR计算软件进行计算可获得蛋白质的 HN(CA)CO、 HNCACB、 HN(CO)CACB 维结构。 a 白的 42 ④ 0Q 2 IN(COXCA Fig.1 Process ar ing pr ensional structure 《a)NR解析蛋白质三维结的流得图。( 共振NCA和N(CO)CA NMRS解析蛋白质三维结构的示意图:①H、C 和N原子核相关自旋系统及NMR数据采集及共振信号分析:②蛋白质样品3DNR请图示意图:③解析氨基酸序列结构:④二面角 (。和y)及质子问距离示章图
·1274· 生物化学与生物物理进展 Prog. Biochem. Biophys. 2022;49(7) 为静磁场强度。 在外加静磁场中,原子核绕其自旋轴旋转,自 旋轴与静磁场保持某一夹角而围绕静磁场方向进动 的频率(ω0 )为: ω0 = γH0 (2) 当用频率为 ω0的射频照射静磁场中自旋运动 的原子核时,原子核才能有效地吸收射频辐射的能 量,从低能级跃迁至高能级,实现核磁共振。所 以,核磁共振波谱来源于原子核能级间的跃迁,即 用一定射频的电磁波对样品进行照射,使特定结构 环境中的原子核发生共振跃迁,记录发生核磁共振 时的信号峰位置和强度,得到核磁共振波谱,其共 振信号反映了官能团和构象等分子结构信息。通常 将1 H、13C和15N原子核的磁共振技术应用于蛋白质 的结构解析,例如通过 NMR 实验获得化学位移、 弛豫时间、耦合常数、核奥弗豪泽效应 (nuclear Overhauser effect,NOE) 等参数,用于研究蛋白 质的三维结构及其分子动力学等[3-7] 。 NMR解析蛋白质三维结构的流程图如图1a所 示。为了避免蛋白质共振信号峰的重叠,提高其分 辨率,一般需要制备15N、13C或2 H标记的蛋白质, 采用15N/13C/1 H三共振多维核磁技术采集实验数据, 对共振信号进行分析、筛选及归属,主要相关的 NMR 技 术 包 括 HNCA、 HN(CO)CA、 HNCO、 HN(CA)CO、 HNCACB、 HN(CO)CACB、 HNCACO、HNCOCA、HNCOi-1CAi 等[8-20]。根据 NMR 软 件 结 合 NMR 技 术 所 获 得 的1 HN 、 15N、 13CO、13Cα 和13Cβ 化学位移、耦合常数和质子间距 离,推算蛋白质主链中氨基酸的序列及其二面角结 构参数,得出蛋白质的二级结构。通过测定NOE、 顺 磁 弛 豫 增 强 (paramagnetic relaxation enhancement,PRE) 以及残余偶极耦合 (residual dipolar coupling,RDC) 等 NMR 参数获得蛋白质 的三维结构约束参数(包括原子间空间距离、化学 键空间取向等),进一步结合 NMR 计算软件解析 蛋白质的三维结构。 以 常 用 的 3D 15N/13C/1 H 三 共 振 HNCA 和 HN(CO)CA NMR为例,蛋白质分子中的氨基酸通 过磁化矢量传递 (图1b①),HNCA可测定同一个 氨基酸内的1 HN和15N原子与13Cα 原子的关联 (以第 i个氨基酸为例),以及第i个氨基酸的1 HN和15N原 子与第i−1个氨基酸13Cα 原子的关联;HN(CO)CA 通常只提供同一个氨基酸内的1 HN和15N 原子与邻 近氨基酸13Cα 原子之间的关联信息。在蛋白质样品 3D NMR谱图中 (图1b②),通过上述关联信息解 析蛋白质主链中氨基酸的序列结构 (图1b③),根 据质子间距离和二面角结构参数 (图1b④),并采 用化学位移预测法解析二级结构。结合结构约束参 数,通过NMR计算软件进行计算可获得蛋白质的 三维结构。 Fig. 1 Process and schemes of investigating protein three-dimensional structure 图1 解析蛋白质三维结构的流程及示意图 (a) NMR解析蛋白质三维结构的流程图。(b) 3D 15N/13C/1 H三共振HNCA和HN(CO)CA NMR解析蛋白质三维结构的示意图:①1 H、13C 和15N原子核相关自旋系统及其NMR数据采集及共振信号分析;②蛋白质样品3D NMR谱图示意图;③解析氨基酸序列结构;④二面角 (ϕCα-N和ψCα-C)及质子间距离示意图
2022:49(7) 尹林,等:核磁共振波谱法在蛋白质三维结构解析中的应用 1275 硫代半乳糖苷(PTG)为诱导剂。目前研究工作 2研究蛋白质三维结构的核磁共振波谱法 主要集中在通过改造该系统中的质粒来提高蛋白质 21蛋白质的同位素标记 的溶银性及产量】 蛋白质的同位素标记包括以下过程:构建含有 由于大肠杆菌表达系统对于一些含有特殊结构 目标蛋白基因序列的质粒,将其导入宿主生物体, 的蛋白质(如含二硫键的蛋白质等)普适性较差 在含有同位素标记物的培养基中进行培养,通过宿 所以发展起来了真核生物表达系统(包括酵母细 主生物表达得到同位素标记蛋白质,采用生化技术 胞,昆虫细胞和哺到动物细胞表状系统))。尽管 进行分离纯化 ,获得高纯度的同位素标记蛋白质。 毕赤座母(Pichia pastoris)常用干表达NC产 2.11标记方法 标记的蛋白质,但是,仍然存在一些缺陷,例如在 均匀同位素标记法被广泛用于蛋白质的同位素 氘代介质中表达时间较长以及选择性地甲基质子化 标记。它主要以N标记的NHCI或(NH)SO 效率较低等 昆虫细胞和哺乳动物细胞表边 作为唯一氨源,℃标记的葡萄糖、甘油、甲醇或 系统需要使用含同位素标记氨基酸的培养基,导致 丙围酸作为唯一的碳源,对蛋白质讲行均匀 制备同位素标记蛋白质的成本较为昂贵。 的NC双标记。为了提高NMR谱灵敏度和 分 些对宿主细胞具有毒性的蛋白质,可采用无细胞表 通常在含D,OH,0的培养基中制备全氘代或剖 达系统】 其特点是具有较高的蛋白质表达 分氘代的N/CP阳三标记蛋白质样品,进行三共 效 振多维核磁测试。 .1.3纯化技术 为了克服大量质子被氘取代而干扰NOE法解 采用同位素标记法及在各种表达系统中得到的 析蛋白质结构的问题,发展了对4种甲基氨基酸 菌体,需要利用生化技术讲一步分离提纯才能获得 选择性地甲基质子化法回 高纯度的同位素标记蛋白样品,主要包括茵体内含 列例如,在含有CH标记葡萄糖 N标记NH,CI利 蛋白的释放 总蛋白的富到 层析色谱法分 D.O的细菌培养基中,加人3HC-a-酮异戊酸 纯、 蛋白质的浓缩以及纯度鉴定等过程。其中层析 (a-ketoisovalerate)制备含有CH,-标记Val和Leu 色谱分离是最重要的一步,它直接决定同位素标记 残基的N/CH蛋白质,加入3.3.HC--围 蛋白样品的纯度和产率。根据同位素标记蛋白不同 酸(a-ketobutyrate)制备含有CH标记le残基 的物理性质(如等申点、容解度、申荷性质等) 的NCH蛋白质 可采用多种层析色谱分离技术, 例如亲和层析色谱 片段同位素标记法有助于降低NMR信号峰的 (如Ni-NTA和Glutathione Sepharose色谱法 重叠程度,用于无序蛋白质(disordered protein 离子交换色谱法(如DEAE色谱法)、体积排阻色 结构的测定、高分子质量蛋白质的结构解析以及蛋 i法(如Superdex、Sephacryl、Sepharose 白质构象变化的研究等1。该方法通过对两个 Sephadex伍满上) 或以上的蛋白质片段进行分别表达,对不同的组分 2.2核磁共振实验数据的采集及其解析的软件 采用不同的同位素标记(N℃阳) 再将这些 22.1 振实验数据采集 白质片段连接起来,组成具有同位素标记片段的完 近年来针对核磁共振技术采集时间长和信噪比 整目标蛋白,主要有表达蛋白连接法(expressed 较低等问题,发展了一些新的NMR实验数据采集 protein ligation.EPL)、蛋白反式剪接法(protein 技术,如非均匀采样(non-uniform sampling)l物 rans-splic g,PTS)和天然化学连接法(native SOFAST (band-selective optimized-flip-angle short- emicalig NCL)等 ADAP (as 2.12表达系统 directed data collection algorithm utilizing a 通常采用的表达系统为原核生物表达系统、直 probabilistic toolkit in NMR) BEST (band 核生物表达系统以及无细胞表达系统。大肠杆菌 selective excitation short-transient)44451,GFT (G. (E.Co)是原核生物表达系统中代表性的表达宿 natrix Fourier t阳nsform)[】将影f由 主它能在各种同位志标记环培中表状蛋白质、 本较低。所以 NMR研究中大肠杆菌表达系 快速采样,信噪比较高,更有利于研究溶液状态下 最为常用,主要以pET为表达载体,异丙基B-D 不稳定的蛋白质二维结构
2022;49(7) 尹林,等:核磁共振波谱法在蛋白质三维结构解析中的应用 ·1275· 2 研究蛋白质三维结构的核磁共振波谱法 2.1 蛋白质的同位素标记 蛋白质的同位素标记包括以下过程:构建含有 目标蛋白基因序列的质粒,将其导入宿主生物体, 在含有同位素标记物的培养基中进行培养,通过宿 主生物表达得到同位素标记蛋白质,采用生化技术 进行分离纯化,获得高纯度的同位素标记蛋白质。 2.1.1 标记方法 均匀同位素标记法被广泛用于蛋白质的同位素 标记[21]。它主要以15N 标记的 NH4Cl 或(NH4 )2SO4 作为唯一氮源,13C标记的葡萄糖、甘油、甲醇或 丙酮酸作为唯一的碳源,对蛋白质 进 行 均 匀 的15N/13C双标记。为了提高NMR谱灵敏度和分辨 率,通常在含D2O/H2O的培养基中制备全氘代或部 分氘代的15N/13C/2 H 三标记蛋白质样品,进行三共 振多维核磁测试。 为了克服大量质子被氘取代而干扰NOE法解 析蛋白质结构的问题,发展了对 4 种甲基氨基酸 (Ala、Val、Leu、Ile) 选择性地甲基质子化法[22] 。 例如,在含有13C/2 H标记葡萄糖、15N标记NH4Cl和 D2O 的细菌培养基中,加入 3- 2 H, 13C-α-酮异戊酸 (α-ketoisovalerate) 制备含有13CH3-标记 Val 和 Leu 残基的15N/13C/2 H蛋白质[23] ,加入3,3- 2 H, 13C-α-酮丁 酸 (α-ketobutyrate) 制备含有13CH3-标记 Ile 残基 的15N/13C/2 H蛋白质[24] 。 片段同位素标记法有助于降低NMR信号峰的 重叠程度,用于无序蛋白质 (disordered protein) 结构的测定、高分子质量蛋白质的结构解析以及蛋 白质构象变化的研究等[25-28] 。该方法通过对两个 或以上的蛋白质片段进行分别表达,对不同的组分 采用不同的同位素标记 (15N/13C/2 H),再将这些蛋 白质片段连接起来,组成具有同位素标记片段的完 整目标蛋白,主要有表达蛋白连接法 (expressed protein ligation,EPL)、蛋白反式剪接法 (protein trans-splicing,PTS) 和天然化学连接法 (native chemical ligation,NCL)等[29-31] 。 2.1.2 表达系统 通常采用的表达系统为原核生物表达系统、真 核生物表达系统以及无细胞表达系统。大肠杆菌 (E. coli) 是原核生物表达系统中代表性的表达宿 主,它能在各种同位素标记环境中表达蛋白质,成 本较低。所以,在NMR研究中大肠杆菌表达系统 最为常用,主要以pET为表达载体,异丙基-β-D- 硫代半乳糖苷 (IPTG) 为诱导剂。目前研究工作 主要集中在通过改造该系统中的质粒来提高蛋白质 的溶解性及产量[32] 。 由于大肠杆菌表达系统对于一些含有特殊结构 的蛋白质 (如含二硫键的蛋白质等) 普适性较差, 所以发展起来了真核生物表达系统 (包括酵母细 胞、昆虫细胞和哺乳动物细胞表达系统)[33] 。尽管 毕赤酵母 (Pichia pastoris) 常用于表达15N/13C/2 H 标记的蛋白质,但是,仍然存在一些缺陷,例如在 氘代介质中表达时间较长以及选择性地甲基质子化 效率较低等[34-35] 。昆虫细胞和哺乳动物细胞表达 系统需要使用含同位素标记氨基酸的培养基,导致 制备同位素标记蛋白质的成本较为昂贵[36-37] 。一 些对宿主细胞具有毒性的蛋白质,可采用无细胞表 达 系 统 , 其 特 点 是 具 有 较 高 的 蛋 白 质 表 达 效率[38-39] 。 2.1.3 纯化技术 采用同位素标记法及在各种表达系统中得到的 菌体,需要利用生化技术进一步分离提纯才能获得 高纯度的同位素标记蛋白样品,主要包括菌体内含 蛋白的释放、总蛋白的富集、层析色谱法分离提 纯、蛋白质的浓缩以及纯度鉴定等过程。其中层析 色谱分离是最重要的一步,它直接决定同位素标记 蛋白样品的纯度和产率。根据同位素标记蛋白不同 的物理性质 (如等电点、溶解度、电荷性质等), 可采用多种层析色谱分离技术,例如亲和层析色谱 法 (如 Ni-NTA 和 Glutathione Sepharose 色谱法)、 离子交换色谱法 (如DEAE色谱法)、体积排阻色 谱 法 ( 如 Superdex、 Sephacryl、 Sepharose 和 Sephadex色谱法)。 2.2 核磁共振实验数据的采集及其解析的软件 2.2.1 核磁共振实验数据采集 近年来针对核磁共振技术采集时间长和信噪比 较低等问题,发展了一些新的NMR实验数据采集 技术,如非均匀采样 (non-uniform sampling)[40]、 SOFAST (band-selective optimized-flip-angle shorttransient)[41-42] 、 ADAPT-NMR (assignmentdirected data collection algorithm utilizing a probabilistic toolkit in NMR)[43] 、 BEST (bandselective excitation short-transient)[44-45]、GFT (Gmatrix Fourier transform)[46] 、 投 影 重 建 (projection reconstruction)[47] 等。这些技术能实现 快速采样,信噪比较高,更有利于研究溶液状态下 不稳定的蛋白质三维结构
1276 生物化学与生物物理进展Prog.Biochem.Biophys. 2022:49(7) 非均匀采样技术不仅保持特了较高的信噪比,而 2.2.2解析核磁共振信号的软件 日将实验数据采集时间缩短为原来的1门16。已 由NMR实验数据得到的谱图,需要对共振信 得到了广泛应用。它主要是在间接维度 号进行归属,经过结构计算和评估才能获得较为准 (indirect dimension)中对NMR数据进行随机选择 确的蛋白质三维结构。然而,对于 一些分子质量轮 性采样,结合特定采样限制因素(例如在每个间接 高的蛋白质,由于其信号蜂的数量显著增多,导致 维度下每个采集时间应至少测量1次等),将得到 NMR谱图解析较为困难。目前已出现了多种化学 的低分辨率数据经过重建算法(reconstruction 位移自动归属软件,用于分析蛋白质主链和侧链的 algorithm)处理,在 一定程度上得到与均匀采样技 结构以及NOESY信号 包括CYANAY PNE-SPARKY.2、APSY 术相当的NMR数据[知]。数据重建算法包括多维分 PONDEROSA NMRNet!、ADAPTNMR4]等。化学位移自动 解法()a、最大堉 归属的在线服务器主要为-PINE web server(htp 重构法(maximum entropy reconstruction)a)、非 i-pine.nmrfam.wisc. nac等改进 等间距数据的傅立叶变换算法(Fourier transform CYANAY中的FLYA算法 能自动归属超大分 algorithms for non-equispacedata)u、机器学习法 质量蛋白质甲基的NOSEY信号。为了获得蛋白质 (nachine learning)】、稀琉多维迭代线形增强法 的三维结构,需要根据田、C、1N化学位移及 (sparse multidimensional iterative lineshape NOE等结构约束参数、采用计算软件计算蛋白质 enhanced,SMLE)ia等 的二级结构和三维结构(表1)。 Table 1 Calculation software of protein s ondary structure unit and three-dime ional structure 表!蛋白质二级结构单元和三维结构的计算软件 考文 结构榄拟软件,依据化学位移日属经验性测蛋白质主链的 bv/NMRPipe/alox/ 16 C之间的旋转角y) CYANA 结构计算软件,在已知氨枯酸序列的前提下,根据NMR实验hph vanaore/vikifindex pboftutorials [56 获取的约束条件(二面角钓束、原子距离约束等)进行蛋白 结构计算,用带白动归属NOESY信号的功能 CNS 根据NOE、合常数、化学位移和偶极祸合 http//ens-online.or/v1.3 [66 Ambe 流约束条件对蛋白质结 位移 、残基偶树 167 NO正号自动自属和蛋白质结构计算软件,采用选代结构计 http://aria.pasteur.frl 6别 算法提高NOE信号归属的效率 PROCHECK 蛋白质结构质量评估在线软件,评估目的蛋白质结构与高分https/ervicesn.mbi.ucla.edu/PROCHECK/ 69列 辨事的蛋白质品体结构之间各结构参数的差异(包括健长 二面角及原子问距离等) 23核磁共振波谱法解析蛋白质的氨基酸序列和 酸侧链质子信号主要分布在0~4ppm,主链及侧链 一级结构单元 的酰胺质子主要分布在7~10ppm,芳香环上的质 获得N、℃或H同位素标记的高纯度蛋白质 样品后,在解析三维结构之 需要进行NMR实验 2.31 统的辨识及蛋白质的氨 的可行性论证 包括选取适合的缓冲溶液体系和测 酸序列解析 试温度以保证在测试过程中蛋白质结构和性质的稳 常见的20种氨基酸残基中有15种残基即为 定性。通过考察NMR线宽的浓度依懒性来判断蛋 个自旋系统,其余5种氨基酸残基则含有多个自旋 白质是否发生聚集等。如果NMR普线太宽(或 系统。根据蛋白质分子质量的大小。通常采用以下 则需要改变实验条件进行改 两种方法进行氨基酸残基自旋系统的辨识以及氨基 善。在蛋白质HNMR谱图中,甲基及脂肪族氨基 酸序列结构的解析
·1276· 生物化学与生物物理进展 Prog. Biochem. Biophys. 2022;49(7) 非均匀采样技术不仅保持了较高的信噪比,而 且将实验数据采集时间缩短为原来的 1/2~1/6,已 得 到 了 广 泛 应 用[48-49]。 它 主 要 是 在 间 接 维 度 (indirect dimension) 中对 NMR 数据进行随机选择 性采样,结合特定采样限制因素(例如在每个间接 维度下每个采集时间应至少测量1次等),将得到 的 低 分 辨 率 数 据 经 过 重 建 算 法 (reconstruction algorithm)处理,在一定程度上得到与均匀采样技 术相当的NMR数据[50] 。数据重建算法包括多维分 解法(multidimensional decomposition)[48] 、最大熵 重构法 (maximum entropy reconstruction)[49]、非 等间距数据的傅立叶变换算法 (Fourier transform algorithms for non-equispaced data)[51] 、机器学习法 (machine learning)[52]、稀疏多维迭代线形增强法 (sparse multidimensional iterative lineshapeenhanced,SMILE)[53]等。 2.2.2 解析核磁共振信号的软件 由NMR实验数据得到的谱图,需要对共振信 号进行归属,经过结构计算和评估才能获得较为准 确的蛋白质三维结构。然而,对于一些分子质量较 高的蛋白质,由于其信号峰的数量显著增多,导致 NMR谱图解析较为困难。目前已出现了多种化学 位移自动归属软件,用于分析蛋白质主链和侧链的 结 构 以 及 NOESY 信 号 , 包 括 CYANAY[54-56]、 PINE-SPARKY.2[57] 、APSY[58-60] 、PONDEROSA[61] 、 NMRNet[62]、ADAPT-NMR[43] 等。化学位移自动 归属的在线服务器主要为I-PINE web server(http:// i-pine.nmrfam.wisc.edu/)[63]。Pritisanac 等[64] 改进 了CYANAY中的FLYA算法,能自动归属超大分子 质量蛋白质甲基的NOSEY信号。为了获得蛋白质 的三维结构,需要根据1 H、13C、15N 化学位移及 NOE 等结构约束参数、采用计算软件计算蛋白质 的二级结构和三维结构(表1)。 2.3 核磁共振波谱法解析蛋白质的氨基酸序列和 二级结构单元 获得15N、13C或2 H同位素标记的高纯度蛋白质 样品后,在解析三维结构之前需要进行NMR实验 的可行性论证,包括选取适合的缓冲溶液体系和测 试温度以保证在测试过程中蛋白质结构和性质的稳 定性,通过考察NMR线宽的浓度依赖性来判断蛋 白质是否发生聚集等。如果 NMR 谱线太宽 (或 NMR 峰重叠严重),则需要改变实验条件进行改 善。在蛋白质1 H NMR谱图中,甲基及脂肪族氨基 酸侧链质子信号主要分布在0~4 ppm,主链及侧链 的酰胺质子主要分布在 7~10 ppm,芳香环上的质 子信号主要分布在6~8 ppm。 2.3.1 氨基酸残基自旋系统的辨识及蛋白质的氨基 酸序列解析 常见的20种氨基酸残基中有15种残基即为一 个自旋系统,其余5种氨基酸残基则含有多个自旋 系统。根据蛋白质分子质量的大小,通常采用以下 两种方法进行氨基酸残基自旋系统的辨识以及氨基 酸序列结构的解析。 Table 1 Calculation software of protein secondary structure unit and three-dimensional structure 表1 蛋白质二级结构单元和三维结构的计算软件 软件 TALOS+ CYANA CNS Amber Aria PROCHECK 功能简介 结构模拟软件,依据化学位移归属经验性预测蛋白质主链的 二面角(即Cα—N之间的旋转角ϕ和Cα—C之间的旋转角ψ) 结构计算软件,在已知氨基酸序列的前提下,根据NMR实验 获取的约束条件(二面角约束、原子距离约束等)进行蛋白 质结构计算,附带自动归属NOESY信号的功能 结构计算软件,根据NOE、耦合常数、化学位移和偶极耦合 等约束条件进行蛋白质结构计算 生物分子模拟和分析程序,根据NOE、化学位移、残基偶极 耦合常数和扭转角等约束条件对蛋白质结构进行优化 NOE信号自动归属和蛋白质结构计算软件,采用迭代结构计 算法提高NOE信号归属的效率 蛋白质结构质量评估在线软件,评估目的蛋白质结构与高分 辨率的蛋白质晶体结构之间各结构参数的差异(包括键长、 二面角及原子间距离等) 网址 https://spin.niddk.nih.gov/NMRPipe/talos/ http://www.cyana.org/wiki/index.php/Tutorials http://cns-online.org/v1.3/ http://ambermd.org/index.php http://aria.pasteur.fr/ https://servicesn.mbi.ucla.edu/PROCHECK/ 参考文献 [65] [56] [66] [67] [68] [69]
2022:49(7) 尹林,等:核磁共振波谱法在蛋白质三雏结构解析中的应用 1277: 分子质量低于14k如的蛋白质一般不需要进行 结构单元的二面角。例如,右毛α螺旋3 同位素标记,其氨基酸自旋系统可用2 D'H NMR 3.9Hz(6=-57),3螺旋1U.=42Hz(6= 技术(如COSY、DQF-COsY、RCT-COSY和 -60),反平行B折叠u=89业(=-139) 0CSY)进行识别 此技犬与N ESY联用可识 平行B折叠 72 别氨基酸的序列结构。其中COSY类技术提供同 安拱速率的质于易形设氢健,通过N0sY测定金 氨基酸的酰胺质子与F质子(NHH,)的关联信 白质样品在H,0和D,0中的质子交换速率来研究氢 息,NOESY提供氨基酸内酰胺质子与邻近氨基酸 键相互作用n。 H严质子(NH,H)的关联信息。由于NOESY和 基干氨基酸N、C和日化学位移数据库的化 将这两种谱 学位移二级结构预测法也常用于解析蛋白质的二级 图的名 半沿着对角线叠合组成 张NOES 结构单元 。然而 由于蛋白质的化学位移容易受 COSY谱 在COSY谐中从NH-H,信号峰的氨 原子核局部磁环境影响.导致其化学位移包含多利 基酸残基自旋系统出发,分别作水平线和垂直线 信息(二级结构单元、侧链构象、氢键、动力学 得到NH和H化学位移,以H原子的化学位移作 溶剂化作用等)。为了更加准确地获得蛋白质 为起占做水平线从NOESY谱中找到NH,的氨 级结构的单一信息,建立了化学位移标志识别法 酸残基自旋系统。 自旋系统的 (chemical shift inde 即根据其数据库建立 顺序。 各种氨基酸白旋系统中N ℃和H的化学位移桐 对于较高分子质量的蛋白质,因为自旋系统信 志参考值,用于解析蛋白质的二级结构单元 号蜂数目增加而容易产生信号峰的重叠,所以,需 相关软件主要有NMRPipe],在线分析服务器主 要制备N/C或N/CH标记的蛋白质样品,采 要为TALOS+Neb Server(https/sDin.niddk nih 用1NCH异核多维NMR排行酸白旋系统 erver/talos/)CSI 2.0 Web Serve 识别,进 步解析氨基酸的序列 Bar等 (http://csi.wishartlab.com/ 将NCH三共振实验应用于解析钙调蛋白 2.4蛋白质的三维结构解析 (16.7ku)的结构以来,出现了更多的三共振脉冲 2.4.1核磁共振波谱法解析蛋白质三维结构 技术:a.分子质量约为1030ku的单链蛋白质,常 在蛋白质氨基酸序列和二级结构单元的解析基 用的三共据实验技术主要有HNCA、HN(COCA 上,通NMR实验讲一测岸结构约束参数 HNCO.HN(CA)CO CBCA(CO)NH CBCANH 包括原子间空间距离 化学键空间取向等) 结 HNCACB和HN(CO)CACB等:b.分子质量高 计算软件计算蛋白质 结构开评估其可官性和 30ku的蛋白质,则需在上述基础上联用TROSY以 确性。NOE和PRE实验可获得原子空间距离约束 及4D、5D和6 D NMR 7 参数,化学罐空间取可知酒时RDC宾验来获 在实际应用中.可将NCH三共振实验按 取(图2) 照关联类型以两个为 组的形式分成4组三共振 MR谱图 a.HNCA (残基内谱图)和H NOE信号强度与两个偶极相互作用的质子之 CA(残基间谱图)b.HNCO(残基间谱图)和 间距离(,1.85A)的六次方成反比。在蛋 HN(CA)CO(残基内谱图):c.CBCANH(残基内 白质三维结构研究中,主要根据NOESY谱图的 接图)和CBCA(CO)NH(残其间谱图) NOE信号强度非得短程距离的质子间距离约吏参 d HncacB(残基内诺图)和HN COICACB(残 数(图2a)。蛋白质三维结构析的准确性依干 OE信号的获取数量和正确归属 然而 伴随者 232 蛋白质的二级结构单元解析 蛋白质分子质量的增加,NOESY谱易出现信号 通过以下NMR技术可测定蛋白质的二级结构 简并和重叠严重的问题。近期出现的异核多绍 单元(α螺旋、B转角、B折叠和无规线团)以及结 NOESY技术,即根据与H键合的异核(C或N) 构特征参数(质子间距离、二面角和氢键相互作 化学位移来分辨NOE交叉信号蜂,能够通过增加 用).a NOESY用王识别有质子间距离≤5A结 维度的方式来减小信县简并和重叠的间顺。对 构特征的二级结构单元: b.DQF-C SY用于测定 分子质量较小的蛋白质(<30k如 常用2DH C.-N-H三键的帮合常数(Jw),进一步确定二级 NOESY、3DsNW"aC-edited-NOESY、3Dc(N/
2022;49(7) 尹林,等:核磁共振波谱法在蛋白质三维结构解析中的应用 ·1277· 分子质量低于14 ku的蛋白质一般不需要进行 同位素标记,其氨基酸自旋系统可用 2D 1 H NMR 技 术 (如 COSY、 DQF-COSY、 RCT-COSY 和 TOCSY)进行识别,这些技术与NOESY联用可识 别氨基酸的序列结构。其中COSY类技术提供同一 氨基酸的酰胺质子与 Hα 质子 (NHi - α H)i 的关联信 息,NOESY提供氨基酸内酰胺质子与邻近氨基酸 Hα 质子 (NHi+1- α H)i 的关联信息。由于 NOESY 和 COSY谱图都具有对角对称性,因此,将这两种谱 图的各一半沿着对角线叠合组成一张 NOESYCOSY 谱[70] ,在 COSY 谱中从 NHi - α Hi信号峰的氨 基酸残基自旋系统出发,分别作水平线和垂直线, 得到NHi和α Hi化学位移,以α Hi原子的化学位移作 为起点做水平线,从NOESY谱中找到NHi+1的氨基 酸残基自旋系统,得出各氨基酸残基自旋系统的 顺序。 对于较高分子质量的蛋白质,因为自旋系统信 号峰数目增加而容易产生信号峰的重叠,所以,需 要制备15N/13C 或15N/13C/2 H 标记的蛋白质样品,采 用15N/13C/1 H异核多维NMR进行氨基酸自旋系统的 识别,进一步解析氨基酸的序列。自 Bax 等[8] 将15N/13C/1 H 三 共 振 实 验 应 用 于 解 析 钙 调 蛋 白 (16.7 ku) 的结构以来,出现了更多的三共振脉冲 技术:a. 分子质量约为10~30 ku的单链蛋白质,常 用的三共振实验技术主要有 HNCA、HN(CO)CA、 HNCO、HN(CA)CO、CBCA(CO)NH、CBCANH、 HNCACB 和 HN(CO)CACB 等;b. 分子质量高于 30 ku的蛋白质,则需在上述基础上联用TROSY以 及4D、5D和6D NMR[71-75] 。 在实际应用中,可将15N/13C/1 H 三共振实验按 照关联类型以两个为一组的形式分成 4 组三共振 NMR 谱图:a. HNCA (残基内谱图) 和 HN(CO) CA (残基间谱图);b. HNCO (残基间谱图) 和 HN(CA)CO (残基内谱图);c. CBCANH (残基内 谱 图 ) 和 CBCA(CO)NH ( 残 基 间 谱 图 ); d. HNCACB (残基内谱图) 和HN(CO)CACB (残 基间谱图)。 2.3.2 蛋白质的二级结构单元解析 通过以下NMR技术可测定蛋白质的二级结构 单元(α螺旋、β转角、β折叠和无规线团)以及结 构特征参数 (质子间距离、二面角和氢键相互作 用):a. NOESY用于识别具有质子间距离 ≤ 5 Å结 构特征的二级结构单元;b. DQF-COSY 用于测定 Cα-N-H三键的耦合常数(3 JHNαH),进一步确定二级 结构单元的二面角。例如,右手 α 螺旋3 JHNαH = 3.9 Hz (ϕ = − 57º), 310 螺 旋3 JHNαH = 4.2 Hz (ϕ = −60º),反平行 β 折叠3 JHNαH = 8.9 Hz (ϕ=−139º), 平行β折叠3 JHNαH = 9.7 Hz(ϕ=−119º)[76] ;c. 具有慢 交换速率的质子易形成氢键,通过NOESY测定蛋 白质样品在H2O和D2O中的质子交换速率来研究氢 键相互作用[77] 。 基于氨基酸15N、13C和1 H化学位移数据库的化 学位移二级结构预测法也常用于解析蛋白质的二级 结构单元。然而,由于蛋白质的化学位移容易受到 原子核局部磁环境影响,导致其化学位移包含多种 信息 (二级结构单元、侧链构象、氢键、动力学、 溶剂化作用等)[78] 。为了更加准确地获得蛋白质二 级结构的单一信息,建立了化学位移标志识别法 (chemical shift index,CSI),即根据其数据库建立 各种氨基酸自旋系统中15N、13C和1 H的化学位移标 志参考值,用于解析蛋白质的二级结构单元[79-80] 。 相关软件主要有NMRPipe[81] ,在线分析服务器主 要 为 TALOS+ Web Server (https://spin. niddk. nih. gov/bax/nmrserver/talos/) 和 CSI 2.0 Web Server (http://csi.wishartlab.com/)[65,82] 。 2.4 蛋白质的三维结构解析 2.4.1 核磁共振波谱法解析蛋白质三维结构 在蛋白质氨基酸序列和二级结构单元的解析基 础上,通过 NMR 实验进一步测定结构约束参数 (包括原子间空间距离、化学键空间取向等),结构 计算软件计算蛋白质三维结构并评估其可靠性和准 确性。NOE和PRE实验可获得原子空间距离约束 参数,化学键空间取向则通过 RDC 实验来获 取(图2)。 a. NOE NOE 信号强度与两个偶极相互作用的质子之 间距离(rH-H,1.8~5 Å)的六次方成反比[83] 。在蛋 白质三维结构研究中,主要根据 NOESY 谱图的 NOE 信号强度获得短程距离的质子间距离约束参 数 (图2a)。蛋白质三维结构解析的准确性依赖于 NOE 信号的获取数量和正确归属。然而,伴随着 蛋白质分子质量的增加,NOESY谱易出现信号峰 简并和重叠严重的问题。近期出现的异核多维 NOESY技术,即根据与1 H键合的异核(13C或15N) 化学位移来分辨NOE交叉信号峰,能够通过增加 维度的方式来减小信号峰简并和重叠的问题。对于 分子质量较小的蛋白质 (< 30 ku),常用2D 1 H-1 H NOESY、 3D 15N/13C-edited-NOESY、 3D 13C( 15N)/
1278 生物化学与生物物理进展Prog.Biochem.Biophys. 2022:49(7) (e) r 10-35A 顺中 中 交叉信号峰 HN交叉信号峰 F2/pom Fig.2 NMR thods for acquiring int parameter 图2 测定蛋白 数的NR实哈方法 NOE:b)PRE:(C)RDC。 H-NOESY-HSQC。对于分子质量较大的蛋白 b.PRE 质,则采用3D”NH. NOESY-HSOC PRE技术用于测定蛋白质结构中长程空间距 3DC-H.℃HMQC-NOESY-HMQC、3DN-H 的结构约束参数,原理如图2b所示。未成对单电 TROSY-NOESY 4D N/N HSOC-NOESY 子的顺陵性对其周围的NMR自旋原子核产生顺磁 HSQC、4DC/5 N HMOC-NOESY-HSOC和4D 效应排一步产:生原子间的偶极偶极相互作用 CC HMOC-NOESY-.HSQC。在全氘代蛋白 加快一定空间范围内(1035A)的原子核池像速 质的结构研究中,由于未能获得质子的NOE信号, 2与原子 所 ,通常将全氘代蛋白质 行 选择性质子化。例 到顺磁中心距离 酰胺基团和甲基的质子化 (3)),主要通过H,N-TROSY或H,N-HSQC等 技术进行调定如。 4.+1+i2 (3) 式中,指H原子与未配对单电子(顺磁中心》 基哌啶1氧自由基(TEMPO)等s,顺磁性离 P之间的距离(A),g是电子的g因子,u是玻尔 子螯合剂(乙二胺四乙酸(EDTA) 二乙基三题 磁子,S是总电子自旋量子数,是直空磁导率 五乙酸(DTPA)、1.47.10-四氯杂环十二烷-1.4.7 是H原子的拉摩尔频率(Hz),t,是分子相关时 10-四羧酸(D0TA)等[%1,其中MTSL标签最为 间(ns),t=(x+x),其中z是蛋白质分子的运 常用:b.融合蛋白表达法,即在蛋白质分子中通过 动相关时间 是电子弛豫时间 基因表达引入可螯合顺磁性金属离子的肽链。 通常采用以下两种方法制备顺磁性的蛋白质测 而,这些方法均在蛋白质分子链中引人了顺磁性 式试体系:.化学修饰法,常用的方法为半胱氨酸巯 物质,需要考虑它们对蛋白质自身结构的影响。 基衍生化法,即将蛋白质分子链中半胱氨酸的巯基 c RDC 与顺磁性氯氧化物自由基标签通过化学键合,得到 在较高分子质量蛋白质的结构解析中,常常存 含有顺磁性标签的衍生化蛋白质,顺磁性氯氧化物 在结构约束数据获取较少成较推获得的间颗。导致 自由基标签主要有1氧自由基-2,25,5-四甲基-D-吡 缺乏足够的约柬信息用于精确计算蛋白质的三维结 略啉-3-甲基-甲硫基磺酸盐(MTSL、2,2,6,6-四門 构,因而,需要采用RDC技术获取蛋白质分子中
·1278· 生物化学与生物物理进展 Prog. Biochem. Biophys. 2022;49(7) 1 H-NOESY-HSQC[84-86] 。对于分子质量较大的蛋白 质 , 则 采 用 3D 15N-1 H-15N HSQC-NOESY-HSQC、 3D 13C-1 H-13C HMQC-NOESY-HMQC、 3D 15N-1 H TROSY-NOESY、 4D 15N/15N HSQC-NOESYHSQC、 4D 13C/15N HMQC-NOESY-HSQC 和 4D 13C/13C HMQC-NOESY-HSQC[87-90]。在全氘代蛋白 质的结构研究中,由于未能获得质子的NOE信号, 所以,通常将全氘代蛋白质进行选择性质子化,例 如酰胺基团和甲基的质子化[91-92] 。 b. PRE PRE技术用于测定蛋白质结构中长程空间距离 的结构约束参数,原理如图2b所示。未成对单电 子的顺磁性对其周围的NMR自旋原子核产生顺磁 效应,进一步产生原子间的偶极-偶极相互作用, 加快一定空间范围内 (10~35 Å) 的原子核弛豫速 率 (即 PRE 速率,RPara 2)[93] 。RPara 2 与原子核 到顺磁中心距离 (rH-P) 的六次方成反比 (公式 (3)),主要通过1 H, 15N-TROSY 或1 H, 15N-HSQC 等 技术进行测定[94] 。 RPara 2 = 1 15 ( μ0 4π ) 2 γ2 1 g2 e μ2 B S(S + 1) r 6 H - P ( 4τc + 3τc 1 + ω2 H τ2 c ) (3) 式中,rH-P指1 H 原子与未配对单电子 (顺磁中心) P之间的距离 (Å),ge是电子的g因子,μB是玻尔 磁子,S 是总电子自旋量子数,μ0是真空磁导率, ωH是1 H原子的拉摩尔频率 (Hz),τc是分子相关时 间 (ns),τc=(τ -1 r +τ -1 s)-1 ,其中 τr是蛋白质分子的运 动相关时间,τs是电子弛豫时间。 通常采用以下两种方法制备顺磁性的蛋白质测 试体系:a. 化学修饰法,常用的方法为半胱氨酸巯 基衍生化法,即将蛋白质分子链中半胱氨酸的巯基 与顺磁性氮氧化物自由基标签通过化学键合,得到 含有顺磁性标签的衍生化蛋白质,顺磁性氮氧化物 自由基标签主要有1-氧自由基-2,2,5,5-四甲基-D-吡 咯啉-3-甲基-甲硫基磺酸盐 (MTSL)、2,2,6,6-四甲 基哌啶-1-氧自由基 (TEMPO) 等[95-96] ,顺磁性离 子螯合剂 (乙二胺四乙酸 (EDTA)、二乙基三胺 五乙酸 (DTPA)、1,4,7,10-四氮杂环十二烷-1,4,7, 10-四羧酸(DOTA)等[96-98] ,其中MTSL标签最为 常用;b. 融合蛋白表达法,即在蛋白质分子中通过 基因表达引入可螯合顺磁性金属离子的肽链[99]。 然而,这些方法均在蛋白质分子链中引入了顺磁性 物质,需要考虑它们对蛋白质自身结构的影响。 c. RDC 在较高分子质量蛋白质的结构解析中,常常存 在结构约束数据获取较少或较难获得的问题,导致 缺乏足够的约束信息用于精确计算蛋白质的三维结 构,因而,需要采用RDC技术获取蛋白质分子中 Fig. 2 NMR experimental methods for acquiring protein structural constraint parameters 图2 测定蛋白质结构约束参数的NMR实验方法 (a)NOE;(b)PRE;(c)RDC
2022:49(7) 尹林,等:核磁共振波谱法在蛋白质三维结构解析中的应用 1279 化学键空间取向的约束参数,得到蛋白质中不同结 质的取向作用前的摆合常数为】.受到顺磁性介质 构域之间相对取向的约束信息[]。RDC是指原于 作用产生取向后的耦合常数则为J和残余偶极耦合 核俚极矩间的偶极偶极相石作用产生偶极偶极跳 常数(D)之和。D与原子核P和Q之间的键矢量 豫效应, 导致NMR信号裂分 (偶极拥合裂分)的 ()以及排列张量坐标轴取向 )的 系列于 现象。如图2c所示,对于蛋白质分子中存在偶: 式(4)【,根据计算软件进一步计算蛋白质二级 耦合相互作用的原子核P和Q,它们受到顺磁性介 结构域的空间取向信息。 (Ar.(ow1)e (4) 式中,D是残余偶极耦合常数(),B,是磁感应 a fret 强度(T),k是玻尔兹曼常数 T是测试温度 与PRE技术获得距离约束参数的原理类似 (K),h是普朗克常数,o为存在偶极耦合相互作 FRET法也是基于偶极-偶极相互作用原理,即如果 用的原子核P和Q之间的距离(A),和。分别是 蛋白质分子内或分子间的两个荧光生色团相距一定 发生偶极桐合相互作用原子核P和Q的旋磁比, 距离(约2080A),并且荧光供体基团的荧光发 ¥和△y,分别是磁感应张量的轴向分量和正交分 射被长与荧光受体基团的吸收波长有一定的重叠 荧光供体基团将把能量转移给荧光受体基 子在溶液中处于各向同性的快速翻 使受体基团被激发,产生红移的次级 运动状态,这种各向同性运动带来的平均效应使得 光。上述两个波长重叠的程度越大,FRE门 其偶极耦合裂分的净值为零m。所以,需要采取 能量转移的效率越高。因此,根据FRET能量转利 一些方法限制蛋白质的快速翻滚运动,促使蛋白质 效率,可计算它们之间的距离(公式(5)))。 一定的各向异性,使得偶极耦合裂分的净值不 <R=RKE- 为零。目前文献报道大致有以下两种方法 式中, R为供体和受体荧光基团之间的距离 天然蛋白质含有各向异性磁化率的顶性金属离于 (A),E为FRET能量转移效率,R,为Forster距 (如F等),其周有磁化率可以使蛋白质产生弱 (即某一给定供体受体对的临界转移距离)。常用 向.进而产生RDC信号:b.利用外部取向介质 的荧光供体单体有丹磺酰氯、AlexaFluor类荧光分 诱导蛋白质分子在溶液中定向排列,出现的各向异 子、Tb*荧光离子和四甲基罗丹明(TMR),荧光 性可产生10倍以上的RDC信号[。常用的取向 受体单体为异硫氰酸荧光素(FITC)、Cy3和Cy 介质包括顺磁 金属(如Fe和铜系金属) 荧光分子,丹磺酰-FTC AlexaFluor488-Cy5利 聚乙二醇分子液品、DNA纳米管液品、取向聚丙 Tb”Cy3在FRET能量转移效率达到50%时,R分 烯酰胺凝胶以及取向胶原蛋白凝胶等【s10]如果 别为38、52和62A11。 在蛋白质测试体系中加入两种以上定取向介质,促 在解析蛋白质三维结构方面,单分子FRET 使蛋白质分子沿不同方向定向排列则可获得多个 molecule fret smeret)根据得到的距 D值。计算出更加准确的蛋白质 三维结构 离约束参数并结合分子动力学模拟计 可用 要注意的是,由于外部取向介质法的诱导机制归功 研究运动时间尺度在毫秒范周的蛋白质构象动态变 于蛋白质与介质的空间和电荷相互作用,因此,必 化4。例如.Ha等51将荧光供体(TMR)和 须考虑取向介质对蛋白质自身的结构影响四。 和荧光受体(Cv5)分别修饰到街萄球茵核酸酶 2.42其他生物物理技术铺助解析蛋白质三维结构 (staphylococcal nuclease.SNase)的两个特定位 些生物物理技术有助 点, 通过smFRE SNase分 中TMR 例如荧光共振 Cy5基团的FRET能量转移效率和它们之间的距离 量转移法(Forster/fluorescence resonance energ 发现SNase分子之间存在蛋白骨架结构或侧链在 transfer,,FRET)、化学交联结合质谱技术 毫秒级时间范围内的波动。膜蛋白具有丰富的生命 (chemical cross-linking coupled with mass 功能,与许多疾病有关,已成为主要的药物靶点, spectrometry,CXMS)、小角X射线散射技术法 近期研究报道了采用smFRET研究膜蛋白折叠结构 (mall angel X-ray.SAXS)和冷冻电镜 动力学, 例如研究自插入螺旋膜蛋白和细菌毒素 法(Cryo-electron microscopy,Cyo-EM)。 组装和折叠动力学以及突变引起的膜蛋白错误折叠
2022;49(7) 尹林,等:核磁共振波谱法在蛋白质三维结构解析中的应用 ·1279· 化学键空间取向的约束参数,得到蛋白质中不同结 构域之间相对取向的约束信息[100] 。RDC是指原子 核偶极矩间的偶极-偶极相互作用产生偶极-偶极驰 豫效应,导致NMR信号裂分 (偶极耦合裂分) 的 现象。如图2c所示,对于蛋白质分子中存在偶极 耦合相互作用的原子核P和Q,它们受到顺磁性介 质的取向作用前的耦合常数为J,受到顺磁性介质 作用产生取向后的耦合常数则为J和残余偶极耦合 常数 (D) 之和。D与原子核P和Q之间的键矢量 (θ) 以及排列张量坐标轴取向 (φ) 的关系列于公 式 (4)[101] ,根据计算软件进一步计算蛋白质二级 结构域的空间取向信息。 D = - 1 4π B2 0 15kBT γP γQ h 4π2 r 3 P - Q [ ∆χax (3 cos 2 θ - 1) + 1.5∆χrh sin2 θ cos 2φ ] (4) 式中,D是残余偶极耦合常数 (Hz),B0是磁感应 强度 (T),kB 是玻尔兹曼常数,T 是测试温度 (K),h是普朗克常数,rP-Q为存在偶极耦合相互作 用的原子核P和Q之间的距离(Å),γP和γQ分别是 发生偶极耦合相互作用原子核 P 和 Q 的旋磁比, ∆χax和∆χrh分别是磁感应张量的轴向分量和正交分 量;θ和φ分别是键矢量和排列张量坐标轴的取向。 蛋白质分子在溶液中处于各向同性的快速翻滚 运动状态,这种各向同性运动带来的平均效应使得 其偶极耦合裂分的净值为零[102] 。所以,需要采取 一些方法限制蛋白质的快速翻滚运动,促使蛋白质 产生一定的各向异性,使得偶极耦合裂分的净值不 为零。目前文献报道大致有以下两种方法:a. 一些 天然蛋白质含有各向异性磁化率的顺磁性金属离子 (如Fe3+ 等),其固有磁化率可以使蛋白质产生弱取 向,进而产生RDC信号[103] ;b. 利用外部取向介质 诱导蛋白质分子在溶液中定向排列,出现的各向异 性可产生 10 倍以上的 RDC 信号[104] 。常用的取向 介质包括顺磁性金属 (如Fe3+ 和镧系金属)、烷基- 聚乙二醇分子液晶、DNA纳米管液晶、取向聚丙 烯酰胺凝胶以及取向胶原蛋白凝胶等[105-110] 。如果 在蛋白质测试体系中加入两种以上定取向介质,促 使蛋白质分子沿不同方向定向排列,则可获得多个 D值,计算出更加准确的蛋白质三维结构[111] 。需 要注意的是,由于外部取向介质法的诱导机制归功 于蛋白质与介质的空间和电荷相互作用,因此,必 须考虑取向介质对蛋白质自身的结构影响[112] 。 2.4.2 其他生物物理技术辅助解析蛋白质三维结构 近期研究表明,一些生物物理技术有助于 NMR解析蛋白质的三维结构[113] ,例如荧光共振能 量 转 移 法 (Förster/fluorescence resonance energy transfer, FRET)、 化 学 交 联 结 合 质 谱 技 术 (chemical cross-linking coupled with mass spectrometry,CXMS)、小角 X 射线散射技术法 (small angel X-ray scattering,SAXS) 和冷冻电镜 法(Cryo-electron microscopy,Cryo-EM)。 a. FRET 与 PRE 技术获得距离约束参数的原理类似, FRET法也是基于偶极-偶极相互作用原理,即如果 蛋白质分子内或分子间的两个荧光生色团相距一定 距离 (约 20~80 Å),并且荧光供体基团的荧光发 射波长与荧光受体基团的吸收波长有一定的重叠, 那么,荧光供体基团将把能量转移给荧光受体基 团, 使 受 体 基 团 被 激 发,产 生 红 移 的 次 级 荧 光[113-114]。上述两个波长重叠的程度越大,FRET 能量转移的效率越高。因此,根据FRET能量转移 效率,可计算它们之间的距离(公式(5))[113] 。 = R0(-1) 1/6 (5) 式中,RDA 为供体和受体荧光基团之间的距离 (Å),E 为 FRET 能量转移效率,R0为 Förster 距离 (即某一给定供体-受体对的临界转移距离)。常用 的荧光供体单体有丹磺酰氯、AlexaFluor类荧光分 子、Tb3+ 荧光离子和四甲基罗丹明 (TMR),荧光 受体单体为异硫氰酸荧光素 (FITC)、Cy3 和 Cy5 荧光分子,丹磺酰-FITC、AlexaFluor488-Cy5 和 Tb3+ -Cy3在FRET能量转移效率达到50%时,R0分 别为38、52和62 Å[113] 。 在解析蛋白质三维结构方面,单分子 FRET (single-molecule FRET,smFRET) 根据得到的距 离约束参数并结合分子动力学模拟计算法,可用于 研究运动时间尺度在毫秒范围的蛋白质构象动态变 化[113-114] 。例如,Ha等[115] 将荧光供体(TMR) 和 和荧光受体 (Cy5) 分别修饰到葡萄球菌核酸酶 (staphylococcal nuclease,SNase) 的两个特定位 点,通过 smFRET 测定单个 SNase 分子中 TMR 和 Cy5基团的FRET能量转移效率和它们之间的距离, 发现 SNase 分子之间存在蛋白骨架结构或侧链在 毫秒级时间范围内的波动。膜蛋白具有丰富的生命 功能,与许多疾病有关,已成为主要的药物靶点, 近期研究报道了采用smFRET研究膜蛋白折叠结构 动力学,例如研究自插入螺旋膜蛋白和细菌毒素的 组装和折叠动力学以及突变引起的膜蛋白错误折叠
1280 生物化学与生物物理进展Prog.Biochem.Biophys. 2022:49(7) 等,这些工作将有利于更加了解膜蛋白的折叠结构 样品进行电镜成像。经过傅里叶变化及重建算法构 及机制,以便设计更加高效的药物。 建出初始蛋白质三维电子密度图(Cyo-map),得 b CXMS 出高分排的蛋白质二维结物图1]。与SAXS相 CXMS法是一种获得松散距离约束(spar istance 的技术。该方法采用特定长度 的化学交联剂(长度约10-30A),将单个蛋白质 制,与NMR联合使用可得到高分辨率的蛋白质 或不同蛋白质之间的官能团通过共价键连接起来 维结构【1l31。Gauto等I51将Cvo-EM与NMR联 再对交联蛋白质样品讲行酶切、采用质谱法分析小 用,解析得到较高准确度和精确性(1A以下)的 分子产物的化学结物。利用专的交联数据外理 十二聚集体T正T2氨肽酶(468ku)的三维结构 件得出交联位点的氨基酸残基及其距离约束参数 Bardiaux等通过NOE和RDC等NMR结构约 结合NMR解析蛋白质的三维结构 CXMS 技术计算得到纤维状菌毛(Pls)分子的PpdD亚 技术测试的蛋白质样品不受分子质量的限制,所 基结构.结合CvO-EM电子密度图(分辨率为 以,对于NMR难以解析的高分子质量蛋白质的三 8A)构建出纤维状菌毛的三维结构。 维结构,CXMS技术显示出明显的优势。 Gons 2.5 蛋白质分子激发态结构的解析 等[m最近报道一种政进的CXMS技术可将距离约 蛋白质在生命活动中总是处 种不断运动的 束参数的测量值降至约6A或更小,能够更精确地 状 通过构象变化执行着各种生物功能 解析蛋白质的结构和动力学。Peng等采用双 包括主链运动、侧链芳环转、结构域相对运动 (磺基玻珀酰亚胺)硫酸盐作为交联剂与蛋白质 寡聚体结构域交换等,覆盖了时间尺度从皮秒到秒 硫键异构酶(protein disulfide-isomerase.pDI)的 的变化4。这种构象交换过程中,不同构象状 伯氨或仲氨反应产生稳定的酰胺或亚酰胺键,经过 态之间具有不同的含量和寿命,各状态的含量取决 胰蛋白酶水解以及质谱分析 采用Cr work软件 于它们的相对自由能 ,而寿命则很大程度上取决 解析得到PDI的二聚体结构。 不同状态之间转化的自由能垒大小 。其中,含 c.SAXS 量较大的称为主要状态或基态(major state or SAXS法通过X射线散射实验(X射线波长为 ground state),而含量较低(约5%)的瞬时状态被 0050.5nm、散射角为0.15°)获得蛋白质溶液散 称为次要状态或激发态(minor state or excited state), 由于其含量较低且寿命较短】 只能凭借。 聚集体状态 整体形状等 间的化学交换才能被检测,所以也被称为 息。SAXS能提供蛋白质的全局距离约束条 不可见状态(invisible state) 基态与激发态 件[],作为NMR的补充约束数据,所以 结构之间的构象交换过程可发生在较宽的时间尺度 SAXS与NMR相结合可提高蛋白质三维结构解析 下(图3).,主要NMR技术包括PRE、弛豫 的准确性,常使用的软件主要有XPLOR- 扩散Ia、CPMG RD(cPMG弛豫扩散,Car NIH和CNS等uaa.B。Grish 等将苹果酸 ell-Meib Gill reaxation dis persion) 合醇G(malate synthase G,81.4ku)的RDC (化学交换饱和转移,chemical exchange saturatior NOE和J耦合常数等NMR约束参数与SAXS测定 transfer))、DEST(暗态交换饱和转移,dark state 的全品距离信息结合,分析得出更加精准的三维结 excitation saturation transfer)4a】、H/D交换{4和 构。Schiavina答通过NMR实验得到了尼帕病 ZZ交换等。其中与蛋白质功能联系最为密切 毒磷蛋白N末端结构域(Nipa 的构象施时间尺度是微秒至产 phosphoprotein minal region,NiV-PNT 蛋白质折叠 变构效应和酶催化 个氨基酸)的初始结构,将集合优化方法 ,近些年来发展起来的CPMG RD和 (ensemble optimization method,.EOM)与SAXS散 CEST能更好地研究尺度为微秒至毫秒的蛋白质激 射数据进行匹配分析,优化出高分辨率的NiV-PNT 发态结构(图3a,b) 三维结构。 2.5.1 CPMG RD d.Cryo-EM CPMG RD基于自旋回波(spin echo)原理 Cyo-EM法通过对蛋白质低温冷冻成玻璃态的 以不同CPMG频率施加π脉冲,根据发生的化学交
·1280· 生物化学与生物物理进展 Prog. Biochem. Biophys. 2022;49(7) 等,这些工作将有利于更加了解膜蛋白的折叠结构 及机制,以便设计更加高效的药物[116] 。 b. CXMS CXMS 法是一种获得松散距离约束 (sparse distance restraints) 的技术。该方法采用特定长度 的化学交联剂 (长度约 10~30 Å),将单个蛋白质 或不同蛋白质之间的官能团通过共价键连接起来, 再对交联蛋白质样品进行酶切,采用质谱法分析小 分子产物的化学结构,利用专业的交联数据处理软 件得出交联位点的氨基酸残基及其距离约束参数, 结合 NMR 解析蛋白质的三维结构[113,117]。CXMS 技术测试的蛋白质样品不受分子质量的限制,所 以,对于NMR难以解析的高分子质量蛋白质的三 维结构,CXMS 技术显示出明显的优势。Gong 等[117]最近报道一种改进的CXMS技术可将距离约 束参数的测量值降至约6 Å或更小,能够更精确地 解析蛋白质的结构和动力学。Peng 等[118] 采用双 (磺基琥珀酰亚胺) 硫酸盐作为交联剂与蛋白质二 硫键异构酶 (protein disulfide-isomerase,PDI) 的 伯氨或仲氨反应产生稳定的酰胺或亚酰胺键,经过 胰蛋白酶水解以及质谱分析,采用Crosswork软件 解析得到PDI的二聚体结构。 c. SAXS SAXS法通过X射线散射实验 (X射线波长为 0.05~0.5 nm、散射角为0.1~5°)获得蛋白质溶液散 射强度与角度之间关系[119] ,计算出蛋白质的刚性 尺寸、分子质量、聚集体状态、整体形状等信 息[120-121] 。SAXS 能提供蛋白质的全局距离约束条 件[122-123],作为 NMR 的补充约束数据,所以, SAXS 与 NMR 相结合可提高蛋白质三维结构解析 的准确性[124-125],常使用的软件主要有 XPLORNIH 和 CNS 等[122-124,126] 。Grishaev 等[127] 将苹果酸 合 酶 G (malate synthase G, 81.4 ku) 的 RDC、 NOE 和 J 耦合常数等 NMR 约束参数与 SAXS 测定 的全局距离信息结合,分析得出更加精准的三维结 构。Schiavina等[128] 通过 NMR 实验得到了尼帕病 毒 磷 蛋 白 N 末 端 结 构 域 (Nipah virus phosphoprotein N-terminal region, NiV-PNT, 406 个 氨 基 酸) 的 初 始 结 构 , 将 集 合 优 化 方 法 (ensemble optimization method,EOM) 与SAXS散 射数据进行匹配分析,优化出高分辨率的NiV-PNT 三维结构。 d. Cryo-EM Cryo-EM法通过对蛋白质低温冷冻成玻璃态的 样品进行电镜成像,经过傅里叶变化及重建算法构 建出初始蛋白质三维电子密度图 (Cryo-map),得 出高分辨的蛋白质三维结构图[129-130] 。与 SAXS 相 类似,Cryo-EM主要提供全局距离约束条件,但分 辨率更高。Cryo-EM技术不受蛋白质分子质量的限 制,与NMR联合使用可得到高分辨率的蛋白质三 维结构[131-134] 。Gauto 等[135] 将 Cryo-EM 与 NMR 联 用,解析得到较高准确度和精确性 (1 Å以下) 的 十二聚集体 TET2 氨肽酶 (468 ku) 的三维结构。 Bardiaux等[136] 通过NOE和RDC等NMR结构约束 技术计算得到纤维状菌毛 (Pilus) 分子的PpdD亚 基结构,结合 Cryo-EM 电子密度图 (分辨率为 8 Å)构建出纤维状菌毛的三维结构。 2.5 蛋白质分子激发态结构的解析 蛋白质在生命活动中总是处于一种不断运动的 状态,通过构象变化执行着各种生物功能[137-138], 包括主链运动、侧链芳环翻转、结构域相对运动、 寡聚体结构域交换等,覆盖了时间尺度从皮秒到秒 的变化[4,104] 。这种构象交换过程中,不同构象状 态之间具有不同的含量和寿命,各状态的含量取决 于它们的相对自由能,而寿命则很大程度上取决于 不同状态之间转化的自由能垒大小[139] 。其中,含 量 较 大 的 称 为 主 要 状 态 或 基 态 (major state or ground state),而含量较低(约5%)的瞬时状态被 称 为 次 要 状 态 或 激 发 态 (minor state or excited state),由于其含量较低且寿命较短,只能凭借它 与基态之间的化学交换才能被检测,所以也被称为 不可见状态 (invisible state)[140-141] 。基态与激发态 结构之间的构象交换过程可发生在较宽的时间尺度 下 (图3)[104,142] ,主要NMR技术包括PRE、弛豫 扩 散[143]、 CPMG RD (cPMG 弛 豫 扩 散 , CarrPurcell-Meiboom-Gill relaxation dispersion)、CEST (化学交换饱和转移,chemical exchange saturation transfer)、DEST (暗态交换饱和转移,dark state excitation saturation transfer)[144]、H/D 交换[145] 和 ZZ 交换[146] 等。其中与蛋白质功能联系最为密切 的构象交换时间尺度是微秒至毫秒,例如配体的结 合 与 释 放 、 蛋 白 质 折 叠 、 变 构 效 应 和 酶 催 化 等[104,147]。 近 些 年 来 发 展 起 来 的 CPMG RD 和 CEST能更好地研究尺度为微秒至毫秒的蛋白质激 发态结构(图3a,b)。 2.5.1 CPMG RD CPMG RD 基于自旋回波 (spin-echo) 原理, 以不同CPMG频率施加π脉冲,根据发生的化学交
2022:49(7) 尹林,等:核磁共振波增法在蛋白质三雏结构解析中的应用 1281 蛋白质折叠及变构效应 配体的结合与释放 时间尺度 腹破范增强(PRE D交 DEST 像扩散(R) 残杂偶极帮合(RDC 22交换 CPMGRD ( b。g 10 5200406080100 w/H Fig.3 Timescales of protein motion and main NMR techniques in the study of excited state structure 图3蛋白质的运动时间尺度以及激发态结构研究中的主要NMR技术山,田) (a)CPMG RDE曲线(R :存在化学交换的横向地豫遮率;风。:无化学交换的横向绝摩速率):(6)CEST曲线(:未施加射频场或无 化学交换时某一氨基酸残基的原子枝共信号强度:上施加羽射频场。存在基态和激发态化学交换的某一氨基酸残基的原子枝共信号 度:绿色曲线:存在化学交换;黑色曲线:无化学交换) 换测定不同氨基酸残基的弛豫速率和化学位移,分 CC和H严化学位移值.根据RDC获得 析0.3-10ms时间尺度下的蛋白质激发态结构(含 的HN化学键取向信息等结构约束参数,结合 量大于0.5%)。例如采用H.5 N HSOC Xplor--NH等软件进行计算,发现激发态Fyn SH3 MethyI-HSQC或TROSY等测试技术,CPMG RD 结构域的C端为无序状态,暴露出易聚集的末端阝 可测定出蛋白质主特H、N、C和CO以及测 折叠链,这可能是导致淀粉样原纤维形成的原因。 链C和甲基的横向池豫速率(R,)随CPMG频率 以至于诱发神经退行性疾病。 )变化的关系曲线(图3a) 交换速率R 2.5.2 CEST (R与R,之差)不仅能够提供各氨基酸残基发 CEST用于研究构象交换发生在时间尺度为2 生化学交换的情况及它们在激发态的相对含量,而 100ms、寿命为5-50ms的蛋白质激发态结 目可以获得激发态氨基酸残基中不同类型原子核的 构【.。为了检测蛋白质在激发态的构象 化学位移,用于计算较高准确性的激发态蛋白质 CEST将低丰度的激发态构象信息通过化学交换饱 维结构 和转移的方式传递给高丰度的基态构象并加以议 bouvignies第Iis]采用CPMG RD技术分别获 大。如图3b所示,如果蛋白质存在激发态和基态 得了溶酶体激发态结构中主链H、℃和N以及侧 两个相互交换的构象状态,那么,在CEST分析结 链甲基的化学位移 结合CS-Rosetta分子模型构至 果中将出现一对向下的信号峰(绿色曲线),较 技术获得了原子分辨率下溶菌南突变体的激发态结 的信号峰对应于基态,较小的信号峰则对应于激发 构,阐明了不同突变体位点对基态与激发态溶菌酶 态。应用ChemEx钦件包(https/github.com 结构的影响。 Neudecker[s4】桶过CPMG RD /chemex)对信号峰强度进行拟合计算 术测定了yn SH3结构域在激发态的H、N。 可以获得化学交换速率常数、激发态相对含量以及
2022;49(7) 尹林,等:核磁共振波谱法在蛋白质三维结构解析中的应用 ·1281· 换测定不同氨基酸残基的弛豫速率和化学位移,分 析0.3~10 ms时间尺度下的蛋白质激发态结构 (含 量 大 于 0.5%)[147-149] 。 例 如 采 用1 H-15N HSQC、 Methyl-HSQC 或 TROSY 等测试技术,CPMG RD 可测定出蛋白质主链1 HN 、15N、13Cα 和13CO以及侧 链13Cβ 和甲基的横向弛豫速率 (R2 ) 随CPMG频率 (νCPMG) 变化的关系曲线 (图 3a)。交换速率 Rex (R2max与 R2min之差) 不仅能够提供各氨基酸残基发 生化学交换的情况及它们在激发态的相对含量,而 且可以获得激发态氨基酸残基中不同类型原子核的 化学位移,用于计算较高准确性的激发态蛋白质三 维结构[104,139,148-152] 。 Bouvignies 等[153] 采用 CPMG RD 技术分别获 得了溶酶体激发态结构中主链1 H、13C和15N以及侧 链甲基的化学位移,结合CS-Rosetta分子模型构建 技术获得了原子分辨率下溶菌酶突变体的激发态结 构,阐明了不同突变体位点对基态与激发态溶菌酶 结构的影响。Neudecker 等[154] 通过 CPMG RD 技 术测定了 Fyn SH3 结构域在激发态的1 HN 、15N、 13CO、 13Cα 和1 Hα 化 学 位 移 值 , 根 据 RDC 获 得 的1 HN - 15N 化学键取向信息等结构约束参数,结合 Xplor-NIH 等软件进行计算,发现激发态 Fyn SH3 结构域的C端为无序状态,暴露出易聚集的末端β 折叠链,这可能是导致淀粉样原纤维形成的原因, 以至于诱发神经退行性疾病。 2.5.2 CEST CEST用于研究构象交换发生在时间尺度为2~ 100 ms、 寿 命 为 5~50 ms 的 蛋 白 质 激 发 态 结 构[104,145]。为了检测蛋白质在激发态的构象, CEST将低丰度的激发态构象信息通过化学交换饱 和转移的方式传递给高丰度的基态构象并加以放 大。如图3b所示,如果蛋白质存在激发态和基态 两个相互交换的构象状态,那么,在CEST分析结 果中将出现一对向下的信号峰 (绿色曲线),较大 的信号峰对应于基态,较小的信号峰则对应于激发 态[1]。 应 用 ChemEx 软 件 包 (https://github. com/ gbouvignies/chemex) 对信号峰强度进行拟合计算, 可以获得化学交换速率常数、激发态相对含量以及 Fig. 3 Timescales of protein motion and main NMR techniques in the study of excited state structure [1,4,113] 图3 蛋白质的运动时间尺度以及激发态结构研究中的主要NMR技术[1,4,113] (a)CPMG RD曲线(R2max:存在化学交换的横向弛豫速率;R2min:无化学交换的横向弛豫速率);(b)CEST曲线(I0:未施加射频场或无 化学交换时某一氨基酸残基的原子核共振信号强度;I:施加弱射频场,存在基态和激发态化学交换的某一氨基酸残基的原子核共振信号强 度;绿色曲线:存在化学交换;黑色曲线:无化学交换)
1282 生物化学与生物物理进展 Prog.Biochem.Biophys. 2022:49(7) 微发态与基态化学位移的差值等信息。通 和同位素标记方面已有突破性的进展。在NMR技 付H.1 N HSOC或TROSY实验,CST可拾到到的 术方面,最为突出的是FauX等o将H-N 激发态蛋白质主链H、N和C以及侧链甲基的化 CRIPT-TROSY应用于研究超大蛋白质复合体 学位移信息s (900ku),通过比较十四聚体细菌分子伴侣GoE CES 与CPMG RD不同之处主要在于 (bacterial chaperonin60,800ku)与七聚体捕分于 a.CEST更适合研究构象交换时间较慢的蛋白质游 伴GroFS(hacterial cochaperonin60.72ku)复 发态结构:b.CEST中基态与激发态的化学位移差 合前后NMR谱图的差异,分析了复合体的结构及 是更月著日甲准确55町将CEST与RDO PRE 其形成机理。 以及分子对接技术等相结合,可获得原子分辨率下 的激发态 含有甲基和芳香基团的氨基酸残基占蛋白质氨 :维结均【s 基酸残基总数的45%55%,酒常位于蛋白质分子 与CPMG RD 分子对接技术相结 研 的疏水结构域及与配体相互作用的界面中[6。这 发现超氧化物歧化酶的双聚体界面和静电环区域员 使得选择性甲基质子化标记法被成功应用到超大动 导致其聚集的关键区域,有望成为治疗肌萎缩性治 态蛋白质复合体的结构研究中。该方法首先对蛋白 髓侧索硬化(amyotrophic lateral sclerosis)的药物 花点。 质进行全氘代标记,然后选择性地对脂肪族氨基酸 残基(Ala、Ie、Leu、Met、Thr和al)的侧链甲 核磁共振波谱法解析高分子质量单链蛋 基进行质子化。为了获得更多的分子间NOE距离 白及超大蛋白质复合体的三维结构 约束参数用于解析超大蛋白质复合体的三维结构 也会对芳香族氨基酸残基(Phe、Tvr和Trp)进行 31高分子质量单链蛋白的三维结构解析 选择性质子化。 分子质量高于10】 蛋白质在溶液中的 运动速度随者分子质量升高而诚缓, 氨基酸残基侧链甲基的动力学信息可提供毫秒 导致其NMI 尺度下的蛋白质构象变化信息 有助于更全面地 蜂的谱线加宽且共振信号简并和垂叠,增加了三维 识蛋白质结构与功能的关系iw。Huang等[对 结物醒析的推度。对干分子质品的为3080k山的 ScB分子伴侣(70ku)的脂肪族氨基酸残基的甲 单链蛋白质,常采用TROSY联用的3D(或4D) 基以及芳香族氨基酸残基讲行了洗择性质子化标 三共振技术研究蛋白质的 维结构w。例如 Tugarinov等报道 TROSY联用4D-HNCACO 记,以麦芽糖结合蛋白(MBP, 396个氨基酸 碱性磷酸酶(PhoA,47I个氨基酸)为SecB分于 HNCOCA和HNCO.CA 共振NMR 伴倡的结合底物,通过三共振NMR和3DCN TROSY联用3D-HNCO、HN(CA)CO、HNCACB dited NOESY对上述质子化标记基团的共振信号 HN(CO)CACB三世能NMR结合3D-HN(CO) CACB AI3D-HNCACB 2D-N-H-TROSY-HSOC 进行归属,分析了SecB/MBP与SecB/PhoA复合物 可以指认苹果酸合酶G 中分子间NOE信号等参数 发现在SccB分子伴 95%以上的共振信号(主链 ℃。利 长而连续的疏水空腔中存在5个与PhoA结合的侵 侧链C) 得出了主链的氨基酸序列结构 点和7个与MBP结合的位点,揭示了ScB分子伴 Bertelsen等1ss)报道采用类似的NMR技术,解析 侣识别MBP和PhoA底物的机理及其抗折叠的生物 了DnaK蛋白(hacterial heat.shock protein70.70 活性功能 u)主的氨基酸序列结物结合RDC研 Saio等ml对全氘代的触发因子(trigger )K蛋白各结构域之间的相对运动和 结构取向 act0r,正)讲行甲基洗择性标记及芳香族残基洗 超大蛋白质复合体的 维结构解析 择性质子化,经过NMR实验获得了丰富的化学位 生命体中存在以聚集体方式形成的超大蛋白质 移数据和分子间NOE距离信息 解析出TF/Pho 复合体,它们发挥著重要的生物功能,所以 复合物(200k如)的三维结构。这些选择性质子化 NMR研究超大蛋白质复合体的三维结构对解释其 标记法还可用于解析其他超大蛋白质复合体的三维 牛物功能且右重要意义。然而,招大蛋白质复合体 结构.例如DnaJ/PhoA复合物(1115ku)、20S 过高的分子质量导致严重的NMR信号重叠和简 蛋白酶体核心颗粒(20SCP,1000k如)m和 并。为了突破分子质量的限制,目前在NMR技术 SecA分子伴侣(204ku)
·1282· 生物化学与生物物理进展 Prog. Biochem. Biophys. 2022;49(7) 激发态与基态化学位移的差值等信息[155-156]。通 过1 H-15N HSQC或TROSY实验,CEST可检测到的 激发态蛋白质主链1 H、15N和13C以及侧链甲基的化 学位移信息[157-161] 。 CEST 与 CPMG RD 不 同 之 处 主 要 在 于 : a. CEST更适合研究构象交换时间较慢的蛋白质激 发态结构;b. CEST中基态与激发态的化学位移差 异更显著且更准确[155,162] 。将CEST与RDC、PRE 以及分子对接技术等相结合,可获得原子分辨率下 的 激 发 态 三 维 结 构[162]。 例 如 Sekhar 等[163] 将 CEST 与 CPMG RD、分子对接技术相结合,研究 发现超氧化物歧化酶的双聚体界面和静电环区域是 导致其聚集的关键区域,有望成为治疗肌萎缩性脊 髓侧索硬化 (amyotrophic lateral sclerosis) 的药物 靶点。 3 核磁共振波谱法解析高分子质量单链蛋 白及超大蛋白质复合体的三维结构 3.1 高分子质量单链蛋白的三维结构解析 当分子质量高于10 ku时,蛋白质在溶液中的 运动速度随着分子质量升高而减缓,导致其NMR 峰的谱线加宽且共振信号简并和重叠,增加了三维 结构解析的难度。对于分子质量约为 30~80 ku 的 单链蛋白质,常采用 TROSY 联用的 3D (或 4D) 三共振技术研究蛋白质的三维结构[164]。例如 Tugarinov 等报道[91],TROSY 联用 4D-HNCACO、 HNCOCA 和 HNCOi-1CAi 三 共 振 NMR, 以 及 TROSY 联用 3D-HNCO、HN(CA)CO、HNCACB 和HN(CO)CACB三共振NMR,结合3D-HN(CO) CACB 和 3D-HNCACB、 2D-15N-1 H-TROSY-HSQC 和 4D-15N, 15N-NOESY, 可 以 指 认 苹 果 酸 合 酶 G 95%以上的共振信号(主链1 HN 、15N、13Cα 、13CO和 侧 链13Cβ ), 得 出 了 主 链 的 氨 基 酸 序 列 结 构 。 Bertelsen 等[165] 报道采用类似的 NMR 技术,解析 了 DnaK 蛋白 (bacterial heat-shock protein 70,70 ku) 主链的氨基酸序列结构,结合 RDC 研究了 DnaK蛋白各结构域之间的相对运动和结构取向。 3.2 超大蛋白质复合体的三维结构解析 生命体中存在以聚集体方式形成的超大蛋白质 复合体,它们发挥着重要的生物功能,所以, NMR研究超大蛋白质复合体的三维结构对解释其 生物功能具有重要意义。然而,超大蛋白质复合体 过高的分子质量导致严重的 NMR 信号重叠和简 并。为了突破分子质量的限制,目前在NMR技术 和同位素标记方面已有突破性的进展。在NMR技 术 方 面 , 最 为 突 出 的 是 Fiaux 等[166] 将1 H-15N CRIPT-TROSY 应 用 于 研 究 超 大 蛋 白 质 复 合 体 (900 ku),通过比较十四聚体细菌分子伴侣GroEL (bacterial chaperonin 60, 800 ku)与七聚体辅分子 伴侣 GroES (bacterial cochaperonin 60,72 ku) 复 合前后NMR谱图的差异,分析了复合体的结构及 其形成机理。 含有甲基和芳香基团的氨基酸残基占蛋白质氨 基酸残基总数的 45%~55%,通常位于蛋白质分子 的疏水结构域及与配体相互作用的界面中[167] 。这 使得选择性甲基质子化标记法被成功应用到超大动 态蛋白质复合体的结构研究中。该方法首先对蛋白 质进行全氘代标记,然后选择性地对脂肪族氨基酸 残基 (Ala、Ile、Leu、Met、Thr和Val) 的侧链甲 基进行质子化。为了获得更多的分子间NOE距离 约束参数用于解析超大蛋白质复合体的三维结构, 也会对芳香族氨基酸残基 (Phe、Tyr和Trp) 进行 选择性质子化。 氨基酸残基侧链甲基的动力学信息可提供毫秒 尺度下的蛋白质构象变化信息,有助于更全面地认 识蛋白质结构与功能的关系[168] 。Huang 等[169] 对 SecB分子伴侣 (70 ku) 的脂肪族氨基酸残基的甲 基以及芳香族氨基酸残基进行了选择性质子化标 记,以麦芽糖结合蛋白 (MBP,396个氨基酸) 和 碱性磷酸酶 (PhoA,471 个氨基酸) 为 SecB 分子 伴侣的结合底物,通过三共振 NMR 和 3D 13C/15Nedited NOESY 对上述质子化标记基团的共振信号 进行归属,分析了SecB/MBP与SecB/PhoA复合物 中分子间NOE信号等参数,发现在SecB分子伴侣 长而连续的疏水空腔中存在5个与PhoA结合的位 点和7个与MBP结合的位点,揭示了SecB分子伴 侣识别MBP和PhoA底物的机理及其抗折叠的生物 活性功能。 Saio 等[170] 对 全 氘 代 的 触 发 因 子 (trigger factor,TF) 进行甲基选择性标记及芳香族残基选 择性质子化,经过NMR实验获得了丰富的化学位 移数据和分子间 NOE 距离信息,解析出 TF/PhoA 复合物(200 ku)的三维结构。这些选择性质子化 标记法还可用于解析其他超大蛋白质复合体的三维 结构,例如DnaJ/PhoA复合物 (111.5 ku)[85] 、20S 蛋白酶体核心颗粒 (20S CP,1 000 ku)[171] 和 SecA分子伴侣(204 ku)[172]等