基因编辑技术可以对受影响家庭进行DNA测序以提供导致每种疾病突变的详细信息,以及特定基因变化(基因型)与疾病严重程度之间的相关性。随后通过DNA序列的改变和修正,破坏有毒或抑制性基因的功能或恢复必要基因的功能来提供遗传治疗。
目前的基因编辑技术有ZFNs(zinc-finger nucleases)技术、TALENs(transcription activator-like effector nucleases)技术、CRISPR/Cas9技术和BE(base editing)及PE(prime editing)技术。
ZFNs、TALENs和CRISPR/Cas9技术是将DNA打断后依赖非同源末端连接或同源定向重组修复的方式进行修复。
BE可以将某一特定位点的特定碱基对替换为另一指定碱基对。
PE可以通过细胞自我修复机制将一段单链DNA整合到基因组中,而原始序列会通过细胞的修复机制去除掉。
图1. 不同基因编辑技术的作用原理
目前的基因编辑技术通过体细胞修饰治疗患者。这些治疗旨在只影响接受治疗的个人而并不会影响其后代。而在胚胎发生期间或之后发生的基因组变化可以在一些或所有的儿童细胞中发现,包括生殖系。与体细胞编辑不同,经过种系编辑的人类可以将这些编辑传递给后代,因此这种基因编辑技术因有污染人类基因库的潜在风险而不被使用。
图2. 生殖细胞编辑
ZFNs(zinc-finger nucleases)由决定其特异性的锌指蛋白结构域和切割 DNA 的 Fok I 核酸酶结构域共同组成,是一种人工核酸酶。
图3. a为ZFNs与DNA互作用示意图,b为三联锌指结构配对DNA示意图
锌指结构是锌配位DNA结合结构域类转录因子的DNA结合域所使用的一种模体。在人类基因组中有700多种蛋白质中包含至少4000个这样的结构域,占人类基因的2%左右。它们折叠形成ββα构象,这种结构不会直接与DNA结合,而是会稳定模体中的α螺旋,并让α螺旋中暴露在外侧的侧链伸入DNA大沟中。
图4. C2H2型锌指pdb(其中红球为锌离子)
其中最常见的一种锌指为C2H2型锌指由两个半胱氨酸和两个组氨酸与中间的锌离子配位以稳定整个结构。
图5. 人转录因子sp1第二个锌指的pdb结构图,图中间灰球为锌离子
在结构被稳定后,锌指通过其阿尔法螺旋的-1、3、6三个位点对DNA的碱基进行特异性识别。
图6. 人转录因子sp1第三个锌指的pdb结构图
如上图中所示,-1位的R和6位的R特异性识别G,3位的E特异性识别C。
Fok I 是Flavobacterium okeanokoites限制性修饰系统的一员,它识别一个dsDNA的非回文序列5'- GGATG-3'-5'-CATCC-3’。
完成识别后,它会切割GGATG下游9nt和CATCC下游13nt的位点形成一个粘性末端,这意味着它有两个结构域-DNA识别结构域和核酸内切酶结构域。
图7. Fok1蛋白的pdb图
FOk1必须二聚才具有活性,该二聚体的形成需要镁离子辅助。
图8. Fok1蛋白二聚体示意图,D1,D2,D3代表洋红色、绿色、白色的3个结构域,蓝色结构域为核酸内切结构域
首先,Fok I单体在其识别位点与DNA结合。在Mg2+的存在下,裂解域与识别域分离。第二个Fok I分子与另一个识别位点结合,通过其裂解域与第一个分子二聚,并在第一个位点催化裂解。裂解后,两个Fok I分子从DNA中分离出来,或者它们仍然结合在一起,并通过与与其他位点结合的Fok I分子二聚来催化更多的裂解。
图9. Fok1切割机理示意图
1993年Chandrasegaran和金洋均等人将3个锌指结构域与1个 Fok I 核酸酶的水解结构域进行连接,构建出了第一个锌指蛋白核酸酶 。它通过锌指结构域识别DNA序列并通过Fok1的二聚对DNA进行定点切割。
图10. ZNFs与DNA特异性识别结构示意图
TALENs(transcription activator-like effector nucleases)技术的核心是TALE蛋白。TALE蛋白最初是在黄单胞菌中发现的,黄单胞菌是辣椒和番茄细菌性叶斑点病的主要病原体。通过对黄单胞菌关键致病基因avrBs3进行插入突变和缺失分析确定了avrBs3活性必需的3.6-3.7kb区域,对该区域进行测序后发现了一段氨基酸编码区(ORF1),该区域能够编码具有avrBs3活性的蛋白。在另一条链上鉴定出另一段相似的ORF区域,两段区域的相同点是具有17个102bp的重复序列,而该区域编码的蛋白就是TALE蛋白。如图1所示,TALE蛋白的主要结构分为三个部分,包括:中心结构域的串联重复序列(Repeat domain)、核定位信号和酸性转录激活结构域,其中中心结构域的串联重复序列是TALENs技术特异性识别DNA序列的区域。
图11. TALE蛋白结构示意图。图中红色区域表示串联重复序列,黄色区域表示核定位信号,绿色区域表示酸性转录激活结构域。图中展示了串联重复序列的第一个序列,其中12、13位氨基酸为可变氨基酸
串联重复序列一般由34个氨基酸重复单元组成,具有高度的保守性。其中12、13位的氨基酸具有高度可变性,为可变氨基酸(RVD),RVD可以识别四种不同的碱基。每一个重复序列对应识别一个核苷酸,如图2所示。C端的第一个重复序列只有前二十个氨基酸与其他重复单元相同,称为半重复性。
通过尝试不同的RVD氨基酸组合,得到了以下的密码表
因为TALE具有特异性识别DNA序列的能力,类似于锌指蛋白核酸酶(ZFNs)。因此将TALE蛋白中特异性识别区域与FokⅠ核酸酶偶联即可构建新的DNA编辑工具,称为TALENs。由于FokⅠ核酸酶需要二聚才能发挥作用,TALENs也需要成对作用以切断目标DNA位点。同时TALENs技术也存在脱靶现象、费用昂贵且费时、可能会引起机体免疫反应等问题。
碱基编辑(BE)技术提供了不引入DNA双链断裂和外源工体DNA模板的条件下,就可以对单碱基进行转换的可能性。2016年,David R. Liu团队首先报道了胞嘧啶脱氨酶和nCas9组成的CBE系统,可以实现C-T或G-A的转换。
2017年,David R. Liu 团队又开发了由腺嘌呤脱氨酶和nCas9 组成的ABE系统,可以实现A-G或T-C的转换。BE系统主要由dCas9、sgDNA和脱氨酶组成,dCas9是失活的Cas9酶,没有催化活性,但是可以与目标DNA结合,使得sgDNA(single guide DNA)与目标序列的互补链结合,继而DNA双螺旋打开,此时脱氨酶将单个碱基进行转变:对于CBE系统,胞嘧啶脱氨酶将胞嘧啶变为尿嘧啶;对于ABE系统,腺嘌呤脱氨酶将腺嘌呤变为与鸟嘌呤相似的I碱基,I碱基会与C碱基配对。经过碱基变化后,两条DNA链碱基不配对,互补链经过DNA修复之后与新碱基配对,这样就实现了单一碱基对的替换。
图14. CBE技术
图15. ABE技术
碱基编辑技术具有编辑效率高、编辑损伤少等特点,但是使用脱氨酶可能增加癌变的风险,而且可能出现的脱靶效应会严重影响编辑效率。
BE系统的脱靶现象,2019年,David R. Liu团队报道了开发了全新的基因编辑技术PE(prime editor),不仅较好解决了脱靶的问题,而且可以实现全部12种可能的碱基转化。2021年,高彩霞团队与David R. Liu 团队合作,成功建立并优化了适用于植物的PPE (plant prime editing) 编辑系统,实现了对植物基因组精准的碱基编辑。
PE是prime editing,简单来说就是在BE技术的基础上引入逆转录的方法,不仅可以实现单个碱基转换,还可以实现碱基敲除、添加等多种操作。PE技术的原理是通过将Cas9 H840A切口酶和逆转录酶偶连在一起,接着在一种含有一段RNA的pegRNA(prime editing guide RNA)引导下,靶向结合并切开一条 DNA链,逆转录生成的单链DNA会在该切口处与原始序列展开竞争,由于DNA修复的酶一般从5端结合DNA链,所以原始的链倾向于被清除掉,希望加入的片段优先整合到原序列中,这样可以实现碱基替换、增减,也可以实现DNA片段的增减。
PE技术还不成熟,其可靠性有待进一步研究,而且与碱基编辑技术相似,使用逆转录酶和脱氨酶仍然存在安全隐患。
图16. PE技术
CRISPR/Cas9 系统主要由 Cas9 蛋白和单链向导 RNA (sgRNA) 所组成,其中 Cas9 蛋白起切割 DNA 双链的作用, sgRNA起向导的作用,在sgRNA的向导下通过碱基互补配对原则,Cas9蛋白可对不同的靶部位进行切割,实现DNA的双链断裂。
图17. CRISPR/Cas9技术的主要原理
CRISPR/Cas9技术主要过程是crRNA结合到Cas9,Cas9核酸酶的构象发生改变,产生一条能通道,让DNA更容易结合。Cas9/crRNA复合体能够识别PAM(5'-NGG)位点导致DNA解旋,使crRNA找到PAM位点相邻的DNA互补链。当Cas9结合到PAM位点相邻的,与crRNA互补的DNA序列上,REC叶内部的桥螺旋和靶DNA形成RNA-DNA 异源双链结构。PAM位点的识别包括可使靶DNA双链断裂(DSB)的HNH和RuvC核断裂的激活,导致DNA降解。如果crRNA与靶DNA不互补,Cas9将会释放出来,寻找新的PAM位点。DNA中的线性靶基因组断裂后可以通过非同源末端接合(NHEJ)或者同源介导的修复(HDR)来进行修复,而非同源末端接合(NHEJ)会引起插入或者删除错误,从而达到定点敲除某种基因的目的。
在利用CRISPR/Cas9系统进行基因组编辑的过程中,tracrRNA和crRNA可以融合成为1条RNA(sgRNA)表达同样可以起到靶向剪切的作用。因此现在我们用的CRISPR/Cas9工具只有Cas9核酸酶和sgRNA两部分。应用此工具,我们可以非常方便快捷地进行任意基因的编辑改造,比如基因敲除、敲入、定点突变等等。
图18. CRISPR/Cas9技术的基因插入应用
在通常情况下,当细胞出现 DNA 双链断裂的情况时, 会采用高效的非同源末端链接 (Non-homologous end join⁃ing,NHEJ)对断裂的DNA进行修复。但是,在修复过程中通常会发生碱基插入或缺失的错配现象,造成移码突变,使靶标基因失去功能。而CRISPR/Cas9系统可以利用Cas9蛋白对靶基因组进行剪切,形成DNA的双链断裂,进而实现基因敲除。
当DNA双链断裂后,如果有DNA修复模板进入到细胞中,基因组断裂部分会依据修复模板进行同源重组修复 (HDR),从而实现基因敲入。修复模板由需要导入的目标基因和靶序列上下游的同源性序列(同源臂)组成,同源臂的长度和位置由编辑序列的大小决定。DNA 修复模板可以是线性/双链脱氧核苷酸链,也可以是双链DNA质粒。HDR修复模式在细胞中发生率较低,通常小于10%。
CRISPR/Cas9技术的优势是应用范围广泛,基因编辑效率更高,操作简便,费用低廉,局限在于同源重组效率低,PAM序列依赖性还有脱靶效应。
从 1996 年对ZFNs 第一次进行体外验证到2012年CRISPR/Cas9 技术的出现和之后的蓬勃发展,基因编辑技术发展迅速,编辑效率和精确性不断提高,应用领域也不断拓宽。不仅可用于表达调控和基因功能的研究、细胞动物模型的构建、癌基因和药物靶点的筛选,在基因治疗中更是具有巨大的发展前景,为单基因遗传病、癌症等疾病提供了新的治疗方法。
基因治疗通过导入正常基因或者编辑修复缺陷基因,实现治疗疾病的目的。目前,利用基因编辑技术在多种疾病,如单基因遗传病、眼科疾病、艾滋病及肿瘤等的基因治疗中得到了应用。
图19. 基因编辑技术发展历程
镰状细胞病(sickle cell disease, SCD)是由于β-珠蛋白基因的第7 个密码子的单基因点突变造成的。Hoban 等利用ZFNs 特异性靶向于β-珠蛋白基因,并诱导CD34+造血干细胞和祖细胞中的DNA 被切割。当ZFNs 与整合酶缺陷型慢病毒载体或寡核苷酸供体一起传送进细胞时,有效地实现了β-珠蛋白基因座的基因矫正。Hoban 的研究为镰状型细胞性贫血的基因治疗提供了重要的方法路径。
基因编辑技术不仅应用于遗传性疾病的治疗,在非遗传性疾病中也有重大的突破。与年龄相关的黄斑衰退(age-related macular degeneration, AMD)是导致成人失明的主要原因,脉络膜新血管形成(choroidal neovascularization, CNV)是其主要病理学特征,血管生成因子如VEGFA (vascular endothelial growth factor A, VEGFA)基因的高表达是造成病变的主要原因。Kim 等将预先设计好的Cas9 核糖核蛋白 (ribonucleoprotein, RNP)导入成年小鼠眼中,使视网膜色素上皮中VEGFA 基因失活;并且在AMD 的小鼠模型中发现cas9 RNPs 有效地减少了脉络膜新血管生成的面积。该研究表明CRISPR/Cas9 技术有可能用于非遗传性退行性眼部疾病的局部治疗。
基因编辑技术在艾滋病、肿瘤治疗等领域也取得了初步进展。第一次在人类中应用靶向核酸酶是利用ZFNs 技术编辑CCR5 基因抵抗HIV。研究者从HIV 病人中提取T细胞,用ZFNs 技术干扰T细胞中CCR5 基因,由于CCR5 基因是大部分HIV 菌株尤其是早期感染菌株的辅助受体,干扰CCR5 基因的表达可以抗HIV 感染,表明基因编辑技术可能成为艾滋病治疗的新方向。
基因编辑应用于肿瘤治疗,主要是与免疫治疗相结合,尤其是与CAR (chimeric antigen receptor) T细胞,该方法在白血病、淋巴瘤和部分实体瘤中有巨大的发展前景。CARs 包括肿瘤细胞特异抗原的胞外单链可变片段和细胞内嵌合信号域,可以激活T 细胞和杀伤肿瘤细胞。Ren 等使用CRISPR/Cas9 系统同时破坏多个基因位点,产生的TCR (T cell receptor)和HLA-I (HLA class I)缺陷的CAR-T细胞可作为通用的CAR-T 细胞,用于免疫治疗;除了产生通用的CAR-T 细胞,基因编辑技术也可通过敲除编码T 细胞抑制受体或信号分子的基因如PD1(programmed cell death protein 1)和CTLA4 (cytotoxic T lymphocyte-associated protein 4),用于产生增强型CAR-T 细胞。
2016 年,四川大学华西医院卢铀团队开展了CRISPR 基因编辑技术的临床实验,从转移性非小细胞肺癌患者中分离出T 细胞,并使用CRISPR/Cas9 技术敲除细胞中的PD-1 基因,在体外扩增到一定量后再重新输回患者体内,达到杀死肿瘤细胞的目的但是简单的敲除T细胞的抑制因子是一把双刃剑,真正投入临床使用还需要进一步研究敲除这些抑制因子是否会引起细胞的不可控制的增殖或者产生严重的自身免疫。
由于BE技术是在不造成双链DNA断裂的情况下进行的精确碱基转换,这对于基因治疗而言无疑是一个非常有效的工具。β-地中海贫血是由于珠蛋白基因(hemoglobin-beta, HBB)突变所致,中国和东南亚地区的发病原因主要是HBB基因A到G的突变。2017年,中山大学黄军就团队利用单碱基编辑技术在不能发育成熟的人类三元核胚胎中对HBB的点突变进行编辑,即将碱基G改为A从而修正错误。该研究是第一个利用BE技术对遗传疾病突变位点进行精准修复的研究,为治疗新生儿β-型地中海贫血症,甚至为其他遗传性疾病的治疗打开了新窗口。Chadwick团队也通过BE技术实现PCSK9基因的敲除,从而降低血浆胆固醇的水平。
基因编辑技术的快速发展极大地提高了我们对真核细胞基因组进行精准改变的能力。可编辑的核酸酶,尤其是编辑效率更高、操作简单、成本低的CRISPR/Cas 系统,彻底改变了我们对基因组功能的研究。单碱基编辑技术的出现和不断改进,实现了单个碱基的精准转换,降低了脱靶效率。
虽然目前基因编辑技术仍然面临着脱靶效率和潜在的免疫反应等副作用的问题,相信在未来多学科的交叉融合和科学家的共同合作下,新一代基因编辑技术将更加简便、高效、精确,目前存在的问题也会逐步得到解决。随着人们对疾病新的有效靶点的研究突破,特别是对那些传统疗法难以治愈的疾病,可以通过纠正致病基因或引入有益突变来达到治愈疾病的目的。基因编辑技术的临床转化和应用研究值得拭目以待,这将成为下一代转化疗法和治疗范例的关键,也将促进个体化医疗的快速发展。