tale原理
al的核酸识别单位为重复34个恒定氨基酸序列,其中的12、13位点双连氨基酸与a、g、c、t有恒定的对应关系,即ng识别t,hd识别 c,ni识别a,nn识别g。为获得识别某一特定核酸序列的tale,只须按照dna序列将相应tal单元串联克隆即可。由于物种基因组大小的不同,选择的特异序列长度也不同,对于哺乳类动物包括人类,一般选取16-20bp的dna序列作为识别靶点。组成的tale识别模块与核酸酶或转录激活因子相连,导入细胞即可实现基因敲除或激活。

talen基因敲除原理
将识别特异dna序列的tale与内切核酸酶foki偶联,可构建成剪切特异dna序列的内切酶talen。而且foki需形成2聚体方能发挥活性,大大减少了随意剪切的几率。在实际操作中,需在目标基因的编码区或外显子和内显子的交界处选择两处相邻(间隔13-22碱基)的靶序列(一般16-20个碱基)分别进行tal识别模块构建。 将这两个相邻靶点识别模块(分别)融合克隆到foki的n-末端,形成真核表达载体,得到talen质粒对。
将talen质粒对共转入细胞中可实现靶基因敲除。talen质粒对共转入细胞后,表达的融合蛋白,分别与靶位点特异结合, 由于两个talen融合蛋白中的foki临近, 形成二 聚体,发挥非特异性内切酶活性,在两个靶位点之间剪切dna, 形成dsb(double-strand breaks),诱发dna损伤修复机制。细胞可以通过nhej(non-homologous end joining)修复dna, 在此修过程中或多或少地删除或插入了一定数目的碱基,造成移码,形成目标基因敲除突变体。
