CRISPR技术 朱东升13307130231 (选择写 CRISPR技术的初衷是因为2018年影响很大的贺建奎用 CRISPR技术 编辑人类胚胎进行繁殖的事件,本人希望详细地了解、介绍这项技术,全面地剖 析它的好坏利弊。) 【1】技术发展和原理 本人在网上搜集翻阅了大量资料文献尝试过自己重写一遍但是感觉都不如 找到的这篇文章讲得鞭辟入里、浅显易懂所以这部分基本引用的都是这篇文章 https://wenku.baiducom/view/94bd620382c4bb4cf7ec4afe04a1b0717f d5b315.html 作者在开头提到了这是她《基因分子生物学》课程的一篇作业,所以我没把 这篇列在文未的参考文献,不过把她这篇文章內提到的参考文献都列在文末了。 初露锋芒,刮目相看 细菌也有“高级”的获得性免疫系统 到底什么是 CRISPR? 它的中文名很长很拗口,和英文一样不知道怎 么念,却能顾名思义,了解其基因序列上的特点,那就是——成簇的、规律间隔 的、短回文、重复序列( clustered regularly interspaced short palindromic repeats, CRISPR)既然是讲故事就把关子卖到最后,讲到那里再告诉大家这 些定语的含义 是个啥? 任何伟大事物的开端(原谅我下此断言,不过看溢美之词甚盛【21】【22】 也不算过分),任何风云人物的发家,任何跌宕故事的开始,总是不起眼“其貌
CRISPR 技术 朱东升 13307130231 (选择写 CRISPR 技术的初衷是因为 2018 年影响很大的贺建奎用 CRISPR 技术 编辑人类胚胎进行繁殖的事件,本人希望详细地了解、介绍这项技术,全面地剖 析它的好坏利弊。) 【1】技术发展和原理 本人在网上搜集翻阅了大量资料文献,尝试过自己重写一遍但是感觉都不如 找到的这篇文章讲得鞭辟入里、浅显易懂,所以这部分基本引用的都是这篇文章: https://wenku.baidu.com/view/94bd620382c4bb4cf7ec4afe04a1b0717f d5b315.html 作者在开头提到了这是她《基因分子生物学》课程的一篇作业,所以我没把 这篇列在文末的参考文献,不过把她这篇文章内提到的参考文献都列在文末了。 一、 初露锋芒,刮目相看 ——细菌也有“高级”的获得性免疫系统 到底什么是 CRISPR? ——它的中文名很长很拗口,和英文一样不知道怎 么念,却能顾名思义,了解其基因序列上的特点,那就是——成簇的、规律间隔 的、短回文、重复序列(clustered regularly interspaced short palindromic repeats,CRISPR)。 既然是讲故事就把关子卖到最后,讲到那里再告诉大家这 些定语的含义。 是个啥? 任何伟大事物的开端(原谅我下此断言,不过看溢美之词甚盛【21】【22】, 也不算过分),任何风云人物的发家,任何跌宕故事的开始,总是不起眼“其貌
不扬”的,我们的主角 CRISPR系统也不例外 很多综述【3】里都把 CRISPR的起源说在了1987年,还是从我们最熟悉的 E.co·最经典的K-12株系中发现的但是本着挖祖坟的心态费劲找出这篇26年 前的文章【刀】来考据,却发现似乎其中只有这一点是与我们的 CRISPR沾边的 就是这个回文序列。 TCAAAATGGGAGGGAGTTCTACCGCAGAGGCGGGGGAACTCCAAGTGATATCCATCATCGCAT NGGCGTTGCAAACCTY 1. 635) CGGTTTATCCCCGCTGGCGCGGGGAACTCG (1, 664) consensus: CGGTTTATCCCCCCT CGCGGGGAACTC FIG. 5. Comparison of direct-repeat sequences consisting of 61 base pairs in the 3-end flanking region of iap, The 29 highly conserved nucleotides, which contain a dyad symmetry of 14 base pairs(underlined), are shown at the bottom Homologous nucleotides found in at leas wo DNA segments are shown in boldface type. The second translational termination codon is boxed. The nucleotide numbers are in 图1最初在大肠杆菌中发现的 CRISPR序列迹象【7】 “叫”个啥? 这个发现纯属偶然,也没有引起包括发现者本身太大的重视,甚至这种特 征序列都没有一个名字直到2002年在通过计算机操作发现很多原核生物(真 细菌和古细菌)都有类似被21-37bp的回文重复序列间隔开的非重复序列后 他才正式有了这个顾名思义的名字 CRISPR,成簇的、规律间隔的、短回文、重 Ag( clustered regularly interspaced short palindromic repeats, CRISPR 【8】。并且除了这样的特征序列外,在他们的附近还有一写 CRISPR- associated 基因。也就是我们后来说的发挥大刀剪切作用和整合外源片段作用的一系列Cas 蛋白。于是我们基本可以得到这样一张漂亮的模式图,并清楚了 CRISPR系统中 最重要的3大元件 -spacer(白色方块),回文 repeats(双三角),cas等基因
不扬”的,我们的主角 CRISPR 系统也不例外。 很多综述【3】里都把 CRISPR 的起源说在了 1987 年,还是从我们最熟悉的 E.coli,最经典的 K-12 株系中发现的,但是本着挖祖坟的心态费劲找出这篇 26 年 前的文章【7】来考据,却发现似乎其中只有这一点是与我们的 CRISPR 沾边的, 就是这个回文序列。 图 1 最初在大肠杆菌中发现的 CRISPR 序列迹象【7】 “叫”个啥? 这个发现纯属偶然,也没有引起包括发现者本身太大的重视,甚至这种特 征序列都没有一个名字,直到 2002 年,在通过计算机操作发现很多原核生物(真 细菌和古细菌),都有类似被 21-37bp 的回文重复序列间隔开的非重复序列后, 他才正式有了这个顾名思义的名字 CRISPR,成簇的、规律间隔的、短回文、重 复序列(clustered regularly interspaced short palindromic repeats,CRISPR) 【8】。并且除了这样的特征序列外,在他们的附近还有一写 CRISPR-associated 基因。也就是我们后来说的发挥大刀剪切作用和整合外源片段作用的一系列 Cas 蛋白。于是我们基本可以得到这样一张漂亮的模式图,并清楚了 CRISPR 系统中 最重要的 3 大元件—spacer(白色方块),回文 repeats(双三角),cas 等基因
csn csmd csn5 C5 GATATAAACCTAATTACCTCGAGARGGGACGGAAAC CRISPR3 ooO O GTTTTAGAGCTGTGTTGTTTCGAATGGTTCCAAAAC 图2 CRISPR特征序列模式图 “干“个啥? 一开始,由于 spacer序列种内保守,种间差异的特点,一度甚至现在【30】 也在被用来鉴定菌株,回头看来虽然大材小用,但好歹也是广泛应用性的体现 还是和大多数科学发现一样 CRISPR系统的发现经历了一个搞清是个啥? “叫”个啥? 干”个啥的过程 现在我们已经知道他长得什么样子什么特点,可是关于这一奇怪序列是干什 么的,在很长一段时间里众说纷纭 功能显然和 spacer的序列特异性有关,那么是 chromosomal rearrangement? modulation of expression of neighboring genes, target for DNA binding proteins, replicon partitioning, EE DNA repair? 都有道理不过只是猜测,直到2005年,3个课题组独立的数据分析表明 一这些 spacer是外源DNA来源的,病毒或者质粒。【3】于是才让大家想,外 源DNA,这会不会参与了防御外来DNA呢? 2007年 Streptococcus thermophilus的实验证实了这一猜想,于是经过 不断完善,有了我们下面这张华丽丽的示意图,一个只能用 elegant形容的漂亮 的免疫过程
图 2 CRISPR 特征序列模式图 “干“个啥? 一开始,由于 spacer 序列种内保守,种间差异的特点,一度甚至现在【30】 也在被用来鉴定菌株,回头看来虽然大材小用,但好歹也是广泛应用性的体现。 还是和大多数科学发现一样,CRISPR系统的发现经历了一个搞清:是个啥? ——“叫”个啥?—— “干”个啥的过程。 现在我们已经知道他长得什么样子什么特点,可是关于这一奇怪序列是干什 么的,在很长一段时间里众说纷纭。 功能显然和 spacer 的序列特异性有关,那么是 chromosomal rearrangement? modulation of expression of neighboring genes,target for DNA binding proteins,?replicon partitioning,还是 DNA repair? 都有道理不过只是猜测,直到 2005 年,3 个课题组独立的数据分析表明— —这些 spacer 是外源 DNA 来源的,病毒或者质粒。【3】于是才让大家想,外 源 DNA,这会不会参与了防御外来 DNA 呢? 2007 年 Streptococcus thermophilus 的实验证实了这一猜想,于是经过 不断完善,有了我们下面这张华丽丽的示意图,一个只能用 elegant 形容的漂亮 的免疫过程
漂亮的获得性免疫系统—一谁说这是“高等”生物的专长? 如何解说这个漂亮的系统,我想参照我们学过的抗原抗体免疫很容易理解, 这里用一个通俗的比喻(如下图3)简单讲讲 外源DNA就是坏蛋,而抓住坏蛋特征这一最核心的步骤之一则是——靠的 Cas复合体将片段特征 proto- spacer制作成 spacer,整合进 CRISPR序列中 形成记忆。于是接下来的2次免疫中, spacer便可以快速 bingding到 proto spacer上。完成这— target的精确打击过程。干掉入侵者。 估计大家也都注意到了一个特别的“帽子“PAM(下文中也会提到)这里作 为一个防止自身兔疫的机理出现,不难想到当然也同时也制约了 proto- spacer 的选择。 坏蛋进来啦>发现坏置!>抓住坏蛋特征>丰记住坏蛋 特征 抗体”上去大刀跟上灭掉 坏蛋被爆成渣 记得就是你! 抓住你 图3参照图4的免疫流程 Immunization ty against subseque Immunity TOCTCGACTTGTTAAAAAMACTACTGAAGARGCGA AauUUUA
漂亮的获得性免疫系统——谁说这是“高等”生物的专长? 如何解说这个漂亮的系统,我想参照我们学过的抗原抗体免疫很容易理解, 这里用一个通俗的比喻(如下图 3)简单讲讲。 外源 DNA 就是坏蛋,而抓住坏蛋特征这一最核心的步骤之一则是——靠的 Cas 复合体将片段特征 proto-spacer 制作成 spacer,整合进 CRISPR 序列中, 形成记忆。于是接下来的 2 次免疫中,spacer 便可以快速 bingding 到 protospacer 上。完成这一 target 的精确打击过程。干掉入侵者。 估计大家也都注意到了一个特别的“帽子“ PAM(下文中也会提到)这里作 为一个防止自身免疫的机理出现,不难想到当然也同时也制约了 proto-spacer 的选择。 图 3 参照图 4 的免疫流程
图4原核生物 CRISPR获得性系统工作原理图【3】 怎么样?是不是有够震撼?不夸张的说这个流程图真的很冲击我的旧思 想,谁也别“小″看原核生物啊!这么精妙的,不亚于真核的获得性免疫,不得 不:1、让我们惊叹于这个奇妙的世界——造物主和原核小东西们的聪明才智。 2、扪心自问——对于自然和生物,我们真的还知道的太少了 当然, CRISPR也不是原核生物唯一的防御系统,近期的一篇NAR【15】也 横向总结比较了真细菌与古细菌的各种免疫机制。但是毫无疑问的是, CRISPR 的发现极大的扩充了我们对于原核生物生理机制的认知 跟据最新的官方说法【31】目前,已经在48%的真细菌和95%的古细菌中 发现了 CRISPR系统。可以算得上是普遍存在了。2007年就有法国的课题组开 发了一个 CRISP FInder【12】,让大家上传序列,来鉴定该基因组中是否包含 CRISPR从而统计 CRISPR的在原核生物中存在的普遍性。(这里的统计数据和 刚才说的有出入,尚未能证实其关系) CRISPRfinder program online% sh20⊥3 welcome to the buspar wet 828 Input format 图5网络工具 CRISPRFinder(2013年6月5日截图)
图 4 原核生物 CRISPR 获得性系统工作原理图【3】 怎么样?是不是有够震撼?不夸张的说,这个流程图真的很冲击我的旧思 想,谁也别“小”看原核生物啊!这么精妙的,不亚于真核的获得性免疫,不得 不:1、让我们惊叹于这个奇妙的世界——造物主和原核小东西们的聪明才智。 2、扪心自问——对于自然和生物,我们真的还知道的太少了。 当然,CRISPR 也不是原核生物唯一的防御系统,近期的一篇 NAR【15】也 横向总结比较了真细菌与古细菌的各种免疫机制。但是毫无疑问的是,CRISPR 的发现极大的扩充了我们对于原核生物生理机制的认知。 跟据最新的官方说法【31】目前,已经在 48%的真细菌和 95%的古细菌中 发现了 CRISPR 系统。可以算得上是普遍存在了。2007 年就有法国的课题组开 发了一个 CRISPRFinder【12】,让大家上传序列,来鉴定该基因组中是否包含 CRISPR。从而统计 CRISPR 的在原核生物中存在的普遍性。(这里的统计数据和 刚才说的有出入,尚未能证实其关系) 图 5 网络工具 CRISPRFinder(2013 年 6 月 5 日截图)
Tpe aB E1① 图6各种Type的 CRISPR【16】 CRISPR系统也是有很多Type的,不同细菌中含有的 CRISPR的type 也不一样。上图是2013年的一篇非常棒的 review当中对几种type作用机制 的整理。(是不是几年之后绝对入主教科书呢?不入也没道理啊。)在这里,也要 提醒大家特别注意type-Ⅱ,因为后面的故事,Cas9将会扮演绝对主角 似曾相识,本是同根生? 看了上面的流程图,我想大家都会觉得“面熟”,没错,看了下面的一张 比较图,更会觉得原核真核之间机制的相通性。也许,我们的差距没有想象中那 么大
图 6 各种 Type 的 CRISPR【16】 CRISPR 系统也是有很多 Type 的,不同细菌中含有的 CRISPR 的 type 也不一样。上图是 2013 年的一篇非常棒的 review 当中对几种 type 作用机制 的整理。(是不是几年之后绝对入主教科书呢?不入也没道理啊。)在这里,也要 提醒大家特别注意 type-II,因为后面的故事,Cas9 将会扮演绝对主角。 似曾相识,本是同根生? 看了上面的流程图,我想大家都会觉得“面熟”,没错,看了下面的一张 比较图,更会觉得原核真核之间机制的相通性。也许,我们的差距没有想象中那 么大
CRISPR- mediated interference Eukaryotic RNA-interference Foreign DNA Foreign RNA Nudeus CRISPR locus coooooooc.o Source piRNA locus IRNA locus RepeatRepeat Repeat CRISPR transcription Drosha do mIRNA SiRNA Cas or RNase Ill RNA biogenesis crRNA-guided surveillance complex RNA-induced silencing complex Cas protein(s) AGO/PIWI NA- guided interference Target interference 图7和真核RNAi比较 Parallels and distinctions between CRISPR RNA guided silencing systems and RNAi.【11】 深入了解,为“我”所用,指哪打哪 Cas9等机理研究和工具改造 故事如果就到这里,那虽然有趣,充其量也只算是认识自然。其实,真正 的好戏才刚刚开始。 随着 CRISPR重要性的逐渐显现对它的作用机理硏究也一步步深入』【10】 【14】【16】各个方面,各种类型的蛋白作用渐漸清楚。比如如何将 spacer整 合如基因组?【14】中,Csn2作用的模型建立
图 7 和真核 RNAi 比较 Parallels and distinctions between CRISPR RNAguided silencing systems and RNAi.【11】 二、 深入了解,为“我”所用,指哪打哪 ——Cas9 等机理研究和工具改造 故事如果就到这里,那虽然有趣,充其量也只算是认识自然。其实,真正 的好戏才刚刚开始。 随着 CRISPR 重要性的逐渐显现,对它的作用机理研究也一步步深入。【10】 【14】【16】各个方面,各种类型的蛋白作用渐渐清楚。比如如何将 spacer 整 合如基因组?【14】中,Csn2 作用的模型建立
Opening of the CRISPR array as1. Cas2? Repeat duplication through ll-in by polymerase Binding of Csn2 to the DNA-ends 非 of DNA-repair proteins(Ku- like activity) 图8Csn2参与整合 spacer模型 移花接木,给细菌打“疫苗 于是就有人在想,既然这看起来是个不错的免疫体系,既然大肠杆菌中这 个体系看似不够强悍,能不能移植啊? 答案是肯定的。2011年,NAR杂志上,法国的一个课题组【4】正是做了 这样的一件事情—将 Streptococcus thermophilus嗜热链球菌中的 Type-I CRISPR系统利用质粒系统移植到了大肠杆菌当中,发挥了作用!于是他们很愉 悦的得出了结论— CRISPR是可以用来给细菌打疫苗的,我们了解他的天敌, 就可以主动防御,先发制人 同时,几乎是“顺带”,他们还发现了2件事情
图 8 Csn2 参与整合 spacer 模型 移花接木,给细菌打“疫苗”! 于是就有人在想,既然这看起来是个不错的免疫体系,既然大肠杆菌中这 个体系看似不够强悍,能不能移植啊? 答案是肯定的。2011 年,NAR 杂志上,法国的一个课题组【4】正是做了 这样的一件事情——将 Streptococcus thermophilus 嗜热链球菌中的 Type-II CRISPR 系统利用质粒系统移植到了大肠杆菌当中,发挥了作用!于是他们很愉 悦的得出了结论——CRISPR 是可以用来给细菌打疫苗的,我们了解他的天敌, 就可以主动防御,先发制人。 同时,几乎是“顺带”,他们还发现了 2 件事情
1、Cas9“-粒起效”——作为唯需要的,足以起作用的剪切蛋白(强悍 性充分性 2、Cas9“左膀右臂“——起作用依赖 McrA/HNH-和RuvC/ RNaseh 这两个mot.。从此Cas9也从那么多Type【16】的 CRISPR的蛋白中,款款 走入了我们的视线。 s1cas2csn c10° 21 □ PACYC184 Figure 2. CRISPR3, Cas system of S thermophiles provides i ion in E. col cclk. (A) Schematic represe 图9利用质粒实现Cas9-嗜热链球菌¢ RISPR系统往大肠杄菌的移植 所以说第一次他们证明了 CRISPR不但可以免疫自己还可以异源表达, 免疫他人,这就是“疫苗”啊,很有意思。 然而从故事的后续发展来看(如果我梳理的逻辑中没有落掉太多东西),他 们实在浪费了一块宝藏,大材小用了。而这篇文章结果的重要性也被研究者本身 严重低估了。不能说他们愉悦的结论和细菌的疫苗不重要,只能说他们只看透了 层,没有看到更深的一层,没有看得更远 为什么这么说,因为虽然他们没看到,但是有人看到了。并且真正成功的
1、Cas9“一粒起效”——作为唯一需要的,足以起作用的剪切蛋白(强悍 性充分性)。 2、Cas9“左膀右臂“ ——起作用依赖 McrA/HNH- 和 RuvC/RNaseH 这两个 motif. 。从此 Cas9 也从那么多 Type【16】的 CRISPR 的蛋白中,款款 走入了我们的视线。 图 9 利用质粒实现 Cas9-嗜热链球菌 CRISPR 系统往大肠杆菌的移植 所以说第一次,他们证明了 CRISPR 不但可以免疫自己,还可以异源表达, 免疫他人,这就是“疫苗”啊,很有意思。 然而从故事的后续发展来看(如果我梳理的逻辑中没有落掉太多东西),他 们实在浪费了一块宝藏,大材小用了。而这篇文章结果的重要性也被研究者本身 严重低估了。不能说他们愉悦的结论和细菌的疫苗不重要,只能说他们只看透了 一层,没有看到更深的一层,没有看得更远。 为什么这么说,因为虽然他们没看到,但是有人看到了。并且真正成功的
奥秘就在于那两件顺带的发现。 粒起效”,果断改造——从此剑锋直指! 如果要在 CRISPR系统的硏究中树一块里程碑,我想【2】他是。如果要在 这个故事里有个转折,我想他【2】也是。从这里开始, CRISPR的传奇将开始上 演,新代分子生物学革命的帷幕即将拉开! 2012年8月17,一篇看似低调的 Science,看那些胶图和data也没什么 意思,这里用我的语言简单总结一下他们主要做了些什么 (1)证实 tracrrNA, rrnA都是必须的(type特 征) (2)(3)看看Cas9到底在哪里切开?怎么切?--确 定切点2个 domain各切一条 (4)2个RNA不能缺哪段?—确定可介导的 CRNA和 tra rrnA最小区域 (5) seed region不能缺哪段?- protospacer sequence requirements最小区域 (6) PAM motif(NGG,防自身免疫)咋作用? i让ilr抱紧~开个Rop 是的,流水账一样,到这里这文章看起来没啥难度,也没啥亮点。但是 细心地你发现了吗,到这里,他们已经一步一步的把Cas9作为定向内切酶的每 一步机制,方方面面都搞清楚了。 插句,又有一个被忽略(至少在这篇文章里没大动作)的意外惊喜—2个 “左膀右臂" domain是各切一条链 HNh domain切 complementary DNA strand, RuvC-like domain tJ noncomplementary DNA strand
奥秘就在于那两件顺带的发现。 “一粒起效”,果断改造——从此剑锋直指! 如果要在 CRISPR 系统的研究中树一块里程碑,我想【2】他是。如果要在 这个故事里有个转折,我想他【2】也是。从这里开始,CRISPR 的传奇将开始上 演,新一代分子生物学革命的帷幕即将拉开! 2012 年 8 月 17,一篇看似低调的 Science,看那些胶图和 data 也没什么 意思,这里用我的语言简单总结一下他们主要做了些什么: 是的,流水账一样,到这里这文章看起来没啥难度,也没啥亮点。但是, 细心地你发现了吗,到这里,他们已经一步一步的把 Cas9 作为定向内切酶的每 一步机制,方方面面都搞清楚了。 插一句,又有一个被忽略(至少在这篇文章里没大动作)的意外惊喜——2 个 “左膀右臂“domain 是各切一条链,HNH domain 切 complementary DNA strand, RuvC-like domain 切 noncomplementary DNA strand