(科普加八卦)基因编辑和CRISPR/CAS9 的故事
gigivivi
楼主 (北美华人网)
(这篇科普是5年前写的, 准备再写个尾声更新这几年的进展)
不知道大家有没有听说过“基因编辑”(gene editing) 这个词儿, 这可是最近几年生物科技界除了“癌症的免疫治疗” (cancer immunotherapy, 也叫 immuno-oncology) 之外最火爆的词汇。之所以这么火爆是因为基因编辑的技术不但极大限度的推进了生物研究的进程,更提供了在人类疾病治疗上的无限可能性。
其实基因编辑这个概念并不是最近这几年才提出的,但这个技术是在2012年才取得突破。突破来自CRISPR/CAS9技术的发明,从某种意义上说,这个技术的发明是过去五十多年发现DNA双螺旋结构之后,生物界最重大的发明。 也许将来人们会使用一种新的纪年法, 2012年之前是BC (Before CRISPR), 2012年之后是CE (CRISPR Era)。
先介绍基因编辑这个概念, wiki是这么说的: “Genome editing, or genome engineering is a type of genetic engineering in which DNA is inserted, deleted, modified or replaced in the genome of a living organism. ” 简而言之就是改写生物的基因组。这种改写可以是插入新的基因, 去掉原有基因,改造基因,还可以是用新基因取代原有基因。
改造生物的基因组,这个概念对大家来说应该不新鲜吧?从八十年代开始,就有用基因编辑的方法改造小鼠的基因组。过去三十年knock out (把一个特定基因敲掉)和 knock in (在基因组里插入一个特定基因)小鼠在生物研究领域得到广泛应用,极大地推进了人们对特定基因功能的认识。
基因编辑,从根本上说是利用了生物自体固有的同源重组功能 (homologous recombination)。同源重组大家在中学的生物课里应该都学了吧?还记得多少?简而言之就是两段相似的基因片段之间发生DNA序列的交换。Knock out小鼠, knock in小鼠,都是同源重组的产物。下面这张图介绍了同源重组的机制怎样制造基因的knock out 和knock in。 都看明白了吗?还需要解释吗?
从理论上来说,只要两个DNA片段之间有同源性,也就是在序列上相似,就有发生同源重组的可能性。而在实践中,发生同源重组的几率是很低的。要制造Knock out或者knock in小鼠,先把和目标基因有同源性(在上图中用蓝色片段表示)的外源基因引入小鼠的胚胎干细胞中, 只有极少数的胚胎干细胞会发生同源重组,把发生同源重组的胚胎干细胞挑出来,移植到母鼠的子宫里,然后就可以等着Knock out或者knock in小鼠的出生了。 影响这个过程效率的关键是同源重组发生的几率,这个几率是很低的。怎样才能提高这个几率呢?科学家发现如果目标基因的DNA有断裂,那么同源重组发生的几率就会大大提高。在下面这个图里,左边同源重组发生的几率要远远大于右边。
好了,现在我们知道要有效的编辑任何目标基因的关键,是能够在目标基因里引入断裂。现在咱们做个算术题, 人类基因组 有3x10^9个碱基对,要想编辑人类基因组里的任意目标,需要这个引进断裂的酶有连续读多少个碱基的能力呢?DNA有四种碱基 (A, T, C, G),一段4个碱基长的DNA片段有4^4=256 种不同序列的可能性. 4^16=4.3x10^9 , 这个数字和人类基因组碱基对的数量大致相当了。就是说,如果想高效地改造人的基因组里任意一个片段,需要有一个能切断DNA的酶,这个酶 要有至少能认出16个连续碱基的能力。
很长一段时间里,科学家找不到这么一个能连续读出任意16个以上碱基又能切断DNA的酶来用在基因编辑上。当当当!2012年,基因编辑领域终于取得重大突破,科学家发现CRISPR/CAS9 这个系统能承担这个工作。
介绍完了基因编辑的概念,现在我来讲讲CRISPR/CAS9的前生今世。
发现CRISPR/CAS9还是微生物学家的功劳。早在1987年,科学家发现大肠杆菌的基因组里有一些特别的DNA序列(叫CRISPR, Clustered, Regularly Interspaced, Short Palindromic Repeats),就像下图这样, 有很多重复序列(用黑色菱形标志),之间夹着长度大致相等的特殊序列(用不同颜色的正方形标志)。
这些序列有什么用途呢?科学家们一点头绪也没有。在接下来二十年里,又陆陆续续在很多不同种类的细菌里发现了这种序列。直到2005年,三个实验室各自独立发现,那些不重复的特殊序列来自专门感染细菌的病毒(叫噬菌体)的基因组。原来CRISPR这种序列是细菌自我保护的机制,如果一个细菌被噬菌体感染了又侥幸活了下来,这个细菌会选取一些噬菌体基因组里的序列插入到自己的基因组里,并且在插入的序列两边用重复序列标记出来,这样就在自己的基因组里留下了曾经感染过自己的噬菌体的DNA片段, 也就是产生了免疫记忆。如果下一次又被同一种噬菌体感染了,有免疫记忆的细菌一看,嘿!这个妹妹(噬菌体)我见过!之后就能够高速有效地把噬菌体的DNA切断。
有免疫记忆的细菌具体是怎样把噬菌体的DNA切断的呢?这里面的奥秘在2007到2008年渐渐被揭开了。细菌把自己基因组里的CRISPR序列转录成RNA, 如果碰到了和这种RNA序列能互补的DNA片段,就能用CAS9这个酶去把这个DNA切断。CAS9在噬菌体的DNA上切开口子以后,一系列下游机制会跟着发挥作用,把噬菌体的DNA链彻底销毁。 为什么细菌不会切断自己的基因组呢?因为它把插入自己基因组的噬菌体DNA片段两边用重复序列(就是上图里的黑色菱形)标记出来了。
用来识别噬菌体DNA片段的RNA序列有20个碱基那么长, 能识别任意20个碱基长的DNA片段,又能把这个DNA片段切断。如果你是基因编辑领域的研究者,这时候你的脑子是不是该“叮”地响一声?
这下基因编辑领域的科学家群情激昂, 就看谁能先证明CRISPR/CAS9系统能用于基因编辑了。
2012年6月, UC Berkley的科学家Jennifer Doudna 和University of Vienna 的科学家Emmanuelle Charpentier联合在“科学”杂志上发表了一篇文章,证明在试管里CRISPR/CAS9的系统可以用来作基因编辑。他们以UC Berkley的名义在2012年5月递交了关于使用CRISPR/CAS9进行基因编辑的专利申请。
六个月之后,也就是2013年1月, Broad Institute (这是一个由MIT和哈佛联合成立的生物科学研究机构)的科学家张锋的实验室也在“科学”杂志上发表了一篇文章,这次他们证明的是CRISPR/CAS9系统能用来编辑哺乳动物细胞的基因组。Broad Institute在2012年12月提交了专利申请。这下就看出来公立机构(UC Berkeley是加州政府办的)和私立机构之间基金充裕程度的不同了, Broad Institute不但提交了专利申请,还多花钱申请了加快审批 (fast-track review process)。 2014年4月, 美国专利局(United States Patent and Trademark Office)批准了Broad Institute的专利申请。这时候UC Berkeley的专利申请还在审批过程中。
现在八卦一下这个张峰博士。他是中国人, 1982年生。十一岁那年, 他和母亲一起移居到美国的爱荷华州。这又是一个华人小天才, 18岁那年得到了 Intel Science Talent Search的第三名,22岁从哈佛本科毕业 (还曾在庄小威的实验室里待过),27岁从斯坦福大学博士毕业,在Harvard 大学的George Church实验室里做了一年半博士后以后,他就成为Broad Institute的助理教授。 2013年在基因编辑领域取得突破后获奖无数。
2015年4月,UC Berkeley要求美国专利局撤回对Broad Institute专利的批准。理由是UC Berkeley 早在2012年5月就递交了专利申请,而且他们的专利声明(patent claim)更广泛,把在原核生物真核生物哺乳动物里的应用都覆盖了。 Broad Institute的回答是UC Berkeley 在2012年只证明了CRISPR/CAS9系统能在试管里编辑基因,并没有用实验数据证明这个系统能在哺乳动物细胞里工作。 UC Berkeley说在试管里能工作,当然在哺乳动物细胞里也能工作,这是显而易见的 (obvious)。 Broad Institute 说我们也是通过一番努力克服了很多困难才在哺乳动物细胞里证明的,哪有那么显而易见!
2017年2月美国专利局的判决出来了, 支持Broad Institute的说法。然后UC Berkeley就开始了(现在还在)漫长的上诉之路。
(等我这两天再更新过去五年的故事)
不知道大家有没有听说过“基因编辑”(gene editing) 这个词儿, 这可是最近几年生物科技界除了“癌症的免疫治疗” (cancer immunotherapy, 也叫 immuno-oncology) 之外最火爆的词汇。之所以这么火爆是因为基因编辑的技术不但极大限度的推进了生物研究的进程,更提供了在人类疾病治疗上的无限可能性。
其实基因编辑这个概念并不是最近这几年才提出的,但这个技术是在2012年才取得突破。突破来自CRISPR/CAS9技术的发明,从某种意义上说,这个技术的发明是过去五十多年发现DNA双螺旋结构之后,生物界最重大的发明。 也许将来人们会使用一种新的纪年法, 2012年之前是BC (Before CRISPR), 2012年之后是CE (CRISPR Era)。
先介绍基因编辑这个概念, wiki是这么说的: “Genome editing, or genome engineering is a type of genetic engineering in which DNA is inserted, deleted, modified or replaced in the genome of a living organism. ” 简而言之就是改写生物的基因组。这种改写可以是插入新的基因, 去掉原有基因,改造基因,还可以是用新基因取代原有基因。
改造生物的基因组,这个概念对大家来说应该不新鲜吧?从八十年代开始,就有用基因编辑的方法改造小鼠的基因组。过去三十年knock out (把一个特定基因敲掉)和 knock in (在基因组里插入一个特定基因)小鼠在生物研究领域得到广泛应用,极大地推进了人们对特定基因功能的认识。
基因编辑,从根本上说是利用了生物自体固有的同源重组功能 (homologous recombination)。同源重组大家在中学的生物课里应该都学了吧?还记得多少?简而言之就是两段相似的基因片段之间发生DNA序列的交换。Knock out小鼠, knock in小鼠,都是同源重组的产物。下面这张图介绍了同源重组的机制怎样制造基因的knock out 和knock in。 都看明白了吗?还需要解释吗?
从理论上来说,只要两个DNA片段之间有同源性,也就是在序列上相似,就有发生同源重组的可能性。而在实践中,发生同源重组的几率是很低的。要制造Knock out或者knock in小鼠,先把和目标基因有同源性(在上图中用蓝色片段表示)的外源基因引入小鼠的胚胎干细胞中, 只有极少数的胚胎干细胞会发生同源重组,把发生同源重组的胚胎干细胞挑出来,移植到母鼠的子宫里,然后就可以等着Knock out或者knock in小鼠的出生了。 影响这个过程效率的关键是同源重组发生的几率,这个几率是很低的。怎样才能提高这个几率呢?科学家发现如果目标基因的DNA有断裂,那么同源重组发生的几率就会大大提高。在下面这个图里,左边同源重组发生的几率要远远大于右边。
好了,现在我们知道要有效的编辑任何目标基因的关键,是能够在目标基因里引入断裂。现在咱们做个算术题, 人类基因组 有3x10^9个碱基对,要想编辑人类基因组里的任意目标,需要这个引进断裂的酶有连续读多少个碱基的能力呢?DNA有四种碱基 (A, T, C, G),一段4个碱基长的DNA片段有4^4=256 种不同序列的可能性. 4^16=4.3x10^9 , 这个数字和人类基因组碱基对的数量大致相当了。就是说,如果想高效地改造人的基因组里任意一个片段,需要有一个能切断DNA的酶,这个酶 要有至少能认出16个连续碱基的能力。
很长一段时间里,科学家找不到这么一个能连续读出任意16个以上碱基又能切断DNA的酶来用在基因编辑上。当当当!2012年,基因编辑领域终于取得重大突破,科学家发现CRISPR/CAS9 这个系统能承担这个工作。
介绍完了基因编辑的概念,现在我来讲讲CRISPR/CAS9的前生今世。
发现CRISPR/CAS9还是微生物学家的功劳。早在1987年,科学家发现大肠杆菌的基因组里有一些特别的DNA序列(叫CRISPR, Clustered, Regularly Interspaced, Short Palindromic Repeats),就像下图这样, 有很多重复序列(用黑色菱形标志),之间夹着长度大致相等的特殊序列(用不同颜色的正方形标志)。
这些序列有什么用途呢?科学家们一点头绪也没有。在接下来二十年里,又陆陆续续在很多不同种类的细菌里发现了这种序列。直到2005年,三个实验室各自独立发现,那些不重复的特殊序列来自专门感染细菌的病毒(叫噬菌体)的基因组。原来CRISPR这种序列是细菌自我保护的机制,如果一个细菌被噬菌体感染了又侥幸活了下来,这个细菌会选取一些噬菌体基因组里的序列插入到自己的基因组里,并且在插入的序列两边用重复序列标记出来,这样就在自己的基因组里留下了曾经感染过自己的噬菌体的DNA片段, 也就是产生了免疫记忆。如果下一次又被同一种噬菌体感染了,有免疫记忆的细菌一看,嘿!这个妹妹(噬菌体)我见过!之后就能够高速有效地把噬菌体的DNA切断。
有免疫记忆的细菌具体是怎样把噬菌体的DNA切断的呢?这里面的奥秘在2007到2008年渐渐被揭开了。细菌把自己基因组里的CRISPR序列转录成RNA, 如果碰到了和这种RNA序列能互补的DNA片段,就能用CAS9这个酶去把这个DNA切断。CAS9在噬菌体的DNA上切开口子以后,一系列下游机制会跟着发挥作用,把噬菌体的DNA链彻底销毁。 为什么细菌不会切断自己的基因组呢?因为它把插入自己基因组的噬菌体DNA片段两边用重复序列(就是上图里的黑色菱形)标记出来了。
用来识别噬菌体DNA片段的RNA序列有20个碱基那么长, 能识别任意20个碱基长的DNA片段,又能把这个DNA片段切断。如果你是基因编辑领域的研究者,这时候你的脑子是不是该“叮”地响一声?
这下基因编辑领域的科学家群情激昂, 就看谁能先证明CRISPR/CAS9系统能用于基因编辑了。
2012年6月, UC Berkley的科学家Jennifer Doudna 和University of Vienna 的科学家Emmanuelle Charpentier联合在“科学”杂志上发表了一篇文章,证明在试管里CRISPR/CAS9的系统可以用来作基因编辑。他们以UC Berkley的名义在2012年5月递交了关于使用CRISPR/CAS9进行基因编辑的专利申请。
六个月之后,也就是2013年1月, Broad Institute (这是一个由MIT和哈佛联合成立的生物科学研究机构)的科学家张锋的实验室也在“科学”杂志上发表了一篇文章,这次他们证明的是CRISPR/CAS9系统能用来编辑哺乳动物细胞的基因组。Broad Institute在2012年12月提交了专利申请。这下就看出来公立机构(UC Berkeley是加州政府办的)和私立机构之间基金充裕程度的不同了, Broad Institute不但提交了专利申请,还多花钱申请了加快审批 (fast-track review process)。 2014年4月, 美国专利局(United States Patent and Trademark Office)批准了Broad Institute的专利申请。这时候UC Berkeley的专利申请还在审批过程中。
现在八卦一下这个张峰博士。他是中国人, 1982年生。十一岁那年, 他和母亲一起移居到美国的爱荷华州。这又是一个华人小天才, 18岁那年得到了 Intel Science Talent Search的第三名,22岁从哈佛本科毕业 (还曾在庄小威的实验室里待过),27岁从斯坦福大学博士毕业,在Harvard 大学的George Church实验室里做了一年半博士后以后,他就成为Broad Institute的助理教授。 2013年在基因编辑领域取得突破后获奖无数。
2015年4月,UC Berkeley要求美国专利局撤回对Broad Institute专利的批准。理由是UC Berkeley 早在2012年5月就递交了专利申请,而且他们的专利声明(patent claim)更广泛,把在原核生物真核生物哺乳动物里的应用都覆盖了。 Broad Institute的回答是UC Berkeley 在2012年只证明了CRISPR/CAS9系统能在试管里编辑基因,并没有用实验数据证明这个系统能在哺乳动物细胞里工作。 UC Berkeley说在试管里能工作,当然在哺乳动物细胞里也能工作,这是显而易见的 (obvious)。 Broad Institute 说我们也是通过一番努力克服了很多困难才在哺乳动物细胞里证明的,哪有那么显而易见!
2017年2月美国专利局的判决出来了, 支持Broad Institute的说法。然后UC Berkeley就开始了(现在还在)漫长的上诉之路。
(等我这两天再更新过去五年的故事)