您的当前位置:首页正文

一种突变型Tn5转座酶及其制备方法和应用[发明专利]

2024-10-18 来源:威能网
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 106754811 A(43)申请公布日 2017.05.31

(21)申请号 201611196754.4(22)申请日 2016.12.21

(71)申请人 南京诺唯赞生物科技有限公司

地址 210038 江苏省南京市栖霞区科创路

红枫科技园C1-2栋(72)发明人 曹林 张力军 聂俊伟 齐心 

韩锦雄 瞿志鹏 徐晓昱 (74)专利代理机构 北京华仁联合知识产权代理

有限公司 11588

代理人 李珊(51)Int.Cl.

C12N 9/12(2006.01)C12N 15/54(2006.01)C12N 15/10(2006.01)C12N 15/70(2006.01)

(54)发明名称

一种突变型Tn5转座酶及其制备方法和应用(57)摘要

一种突变型Tn5转座酶及其制备方法和应用,对现有EK/LP Tn5转座酶进行降低DNA偏好性的定点突变,所述定点突变是指D97E,D188E、E326D中的至少两个,所述定点突变改进了Tn5转座酶蛋白序列和构象,并配合对反应体系的微调,改进Tn5转座酶对DNA靶序列插入的偏好性,显著改善了DNA建库均一性,并使建库结果具有更好的覆盖度,显著提高建库均一性,适应高通量测序建库的需求。

C40B 50/06(2006.01)C12Q 1/68(2006.01)

权利要求书2页 说明书6页序列表5页 附图2页

CN 106754811 ACN 106754811 A

权 利 要 求 书

1/2页

1.一种突变型Tn5转座酶,其特征在于,所述突变型Tn5转座酶的氨基酸序列为EK/LP Tn5转座酶的氨基酸序列定点突变所得,所述定点突变是指D97E、D188E、E326D中的至少两个;其中,

突变位点1:D97E,即EK/LP Tn5转座酶基酸序列中第97位的丙氨酸突变为谷氨酸;突变位点2:D188E,即EK/LP Tn5转座酶基酸序列中第188位的丙氨酸突变为谷氨酸;突变位点3:E326D,即EK/LP Tn5转座酶基酸序列中第326位的谷氨酸突变为丙氨酸。2.编码权利要求1所述突变型Tn5转座酶的基因。3.根据权利要求1所述的突变型Tn5转座酶,其特征在于,所述突变型Tn5转座酶包含3个定点突变:D97E、D188E、E326D,氨基酸序列如SEQ NO.2所示。

4.编码权利要求3所述的突变型Tn5转座酶的如SEQ NO.3所示的核苷酸序列。5.根据权利要求1所述的突变型Tn5转座酶,其特征在于,所述突变型Tn5转座酶包含2个定点突变:D97E、D188E,编码所述突变型Tn5转座酶的核苷酸序列如SEQ NO.4所示。

6.根据权利要求1所述的突变型Tn5转座酶,其特征在于,所述突变型Tn5转座酶包含2个定点突变:D188E、E326D,编码所述突变型Tn5转座酶的核苷酸序列如SEQ NO.5所示。

7.根据权利要求1所述的突变型Tn5转座酶,其特征在于,所述突变型Tn5转座酶包含2个定点突变:D97E、E326D,编码该突变型Tn5转座酶的核苷酸序列如SEQ NO.6所示。

8.如权利要求1或3或5-7任一项所述的突变型Tn5转座酶在DNA建库中的应用。9.如权利要求1或3或5-7任一项所述的突变型Tn5转座酶的制备方法,包括如下步骤:1)构建含编码所述突变型Tn5转座酶的核苷酸序列的载体利用含有突变位点信息的引物,对含有EK/LP Tn5转座酶基因的质粒进行PCR扩增;PCR扩增得到目的条带后切胶回收,利用Dpn1酶消化原始模板质粒;扩增产物转化到感受态细胞中,涂板挑单克隆摇菌抽提质粒进行鉴定,即可得到含突变型Tn5转座酶基因的载体;

2)得到重组细胞

将步骤1)得到的正确载体转化到B121宿主细胞中,利用抗生素筛选得到正确转化的重组细胞,并挑单克隆;

3)培养并收集重组细胞,提取纯化突变型Tn5转座酶;其中,步骤1)中所述引物包括:引入三个突变位点D97E,D188E、E326D的引物序列,包括:A97-f:gccattgaggaaaccacct;A97-r:aggtggtttcctcaatggc;B188-f:gcggtctgtgaacgcgaagc;B188-r:gcttcgcgttcacagaccgc;C326-f:cggatcgacgagttccata;C326-r:tatggaactcgtcgatccg;或,引入二个突变位点D97E、D188E的引物序列,包括:A97-f:gccattgaggaaaccacct;A97-r:aggtggtttcctcaatggc;B188-f:gcggtctgtgaacgcgaagc;B188-r:gcttcgcgttcacagaccgc;

2

CN 106754811 A

权 利 要 求 书

2/2页

或,引入二个突变位点D188E、E326D的引物序列,包括:B188-f:gcggtctgtgaacgcgaagc;B188-r:gcttcgcgttcacagaccgc;C326-f:cggatcgacgagttccata;C326-r:tatggaactcgtcgatccg;或,引入二个突变位点D97E、E326D的引物序列,包括:C326-f:cggatcgacgagttccata;C326-r:tatggaactcgtcgatccg;A97-f:gccattgaggaaaccacct;A97-r:aggtggtttcctcaatggc。

10.一种利用权利要求1或3或5-7任一项所述突变型Tn5转座酶进行基因组DNA片段化的反应体系为:10~25mM HEPES缓冲液,pH 7.2~7.6;0.1~5mM beta-巯基乙醇;10~80μg/ml牛血清白蛋白;0.1~0.2M谷氨酸钾;0.2~0.5mM MnSO4;0.2~1mM KCl;100~500nM所述突变型Tn5转座酶;50~100ng基因组DNA;0.1~1ng含有19bp转座子序列的接头引物;反应程序:37℃,10min~1h;

其中,所述接头引物包括:转座酶识别序列:AGATGTGTATAAGAGACAG;第一接头序列:AATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTC;第二接头序列:CAAGCAGAAGACGGCATACGAGATGTCTCGTGGGCTCGG。

3

CN 106754811 A

说 明 书

一种突变型Tn5转座酶及其制备方法和应用

1/6页

技术领域[0001]本发明属于生物技术领域,具体涉及一种突变型Tn5转座酶及其制备方法和应用。背景技术[0002]转座酶是一大类细菌来源的蛋白,通过结合转座子序列末端并催化其移动到基因组上随机位置实现“剪切-粘贴”或“复制-粘贴”型的DNA插入的作用。转座酶的种类很多,最先被发现的是能使玉米随机改变颜色的Tn3转座子。天然的转座子在生物中活性很低,在进化过程中起到随机改变遗传物质并推动进化的重要作用。转座酶可以在基因组上引入随机突变的重要性质也被应用于最近迅速发展的二代测序技术中的建库过程,可以在基因组上随机加入已知序列接头用于测序分析。[0003]Tn5转座酶是转座酶的一种,Tn5转座酶进行转座功能的实现需要三个部分共同作用:转座子序列、转座酶、靶DNA位置。野生型Tn5转座酶的活性也是很低的,以减少对宿主产生致命突变的风险。[0004]Tn5转座酶活性很低的部分原因在于其蛋白的N端和C端在三维空间构象上相互接近,并发挥相互抑制的作用。对于N端或C端的突变可以得到高活性形式的突变形转座酶,如L372P,正常的372位亮氨酸处于一个α螺旋中,用丙氨酸取代后使α螺旋结构被破坏,从而产生了C端构象的改变,与N端在空间上发生分离,从而得到活性大大增加的突变蛋白。同时Tn5蛋白含有一个中心催化结构域DDE,即不同位置的D/D/E三个残基在三维构象上形成一个中心的酸性基团,构成能结合二价离子的环形位置,该结构域的已知功能为促进蛋白在DNA上的行进,对这三个酸性残基的分别交换突变可以得到催化性增加、行进性提升的突变蛋白。[0005]目前主流技术为对转座酶表达序列进行定点突变,通过原核表达产生有活性的突变蛋白,对其功能进行体外验证。由此得到最知名的突变即为上文提到的,N端和C端空间距离得到高活性蛋白和改变催化基团DDE基团内残基得到的催化活性增加的突变蛋白。[0006]虽然现在主流使用的突变型Tn5转座酶转座插入活性和对DNA的亲和性都得到了有效增强,但在目前酶的活性和稳定性提升的基础上还是存在靶DNA序列偏好性,偏好性是转座酶应用于建库的一个短板,在建库过程中加接头的偏好性会导致结果的不均一和缺失,导致结果的覆盖度有问题。发明内容[0007]本发明的目的是在于提供一种突变型Tn5转座酶及其制备方法和应用,降低Tn5转座酶对DNA靶序列插入位点选择性,使测序DNA建库分布更均一,并具有更好的覆盖度,适应高通量测序建库的需求。[0008]为达到上述目的,本发明的技术方案如下:[0009]一种突变型Tn5转座酶,所述突变型Tn5转座酶的氨基酸序列为EK/LPTn5转座酶的氨基酸序列定点突变所得,所述定点突变是指D97E,D188E、E326D中的至少两个;其中,突变

4

CN 106754811 A

说 明 书

2/6页

位点1:D97E,即EK/LP Tn5转座酶基酸序列中第97位的丙氨酸突变为谷氨酸;突变位点2:D188E,即EK/LP Tn5转座酶基酸序列中第188位的丙氨酸突变为谷氨酸;突变位点3:E326D,即EK/LP Tn5转座酶基酸序列中第326位的谷氨酸突变为丙氨酸。[0010]优选的,一种突变型Tn5转座酶,包含3个定点突变:D97E,D188E、E326D,该突变型Tn5转座酶的氨基酸序列如SEQ NO.2所示。[0011]本发明还提供编码氨基酸序列如SEQ NO.2所示的突变型Tn5转座酶的基因。[0012]更优选的,还提供编码氨基酸序列如SEQ NO.2所示的突变型Tn5转座酶的如SEQ NO.3所示的核苷酸序列。需要说明的是,由于同一氨基酸可能有多种不同的密码子来决定,所以编码上述突变型Tn5转座酶的核苷酸序列并不局限于SEQ NO.3所示序列,也可以是由与SEQ NO.3所示核苷酸序列突变一个或几个核苷酸形成同义突变得到可编码相同氨基酸序列的核苷酸序列。[0013]优选的,一种突变型Tn5转座酶,包含2个定点突变:D97E、D188E,编码该突变型Tn5转座酶的核苷酸序列如SEQ NO.4所示。[0014]优选的,一种突变型Tn5转座酶,包含2个定点突变:D188E、E326D,编码该突变型Tn5转座酶的核苷酸序列如SEQ NO.5所示。[0015]优选的,一种突变型Tn5转座酶,包含2个定点突变:D97E、E326D,编码该突变型Tn5转座酶的核苷酸序列如SEQ NO.6所示。[0016]本发明所述突变型Tn5转座酶的制备方法,包括如下步骤:[0017]1)构建含编码所述突变型Tn5转座酶的核苷酸序列的载体[0018]利用含有突变位点信息的引物,对含有EK/LP Tn5转座酶基因的质粒进行PCR扩增;PCR扩增得到目的条带后切胶回收,利用Dpn1酶消化原始模板质粒;产物纯化后转化到感受态细胞中,涂板挑单克隆鉴定即可得到含突变型Tn5转座酶基因的载体;[0019]2)得到重组细胞[0020]将步骤1)得到的载体转化到B121宿主细胞中,利用抗生素筛选得到正确转化的重组细胞,并挑单克隆;[0021]3)培养并收集重组细胞,提取纯化突变型Tn5转座酶。[0022]进一步,步骤1)中所述含有突变位点信息的引物包含了需要突变的位点和替换过的碱基,具体序列如下:包含引入三个突变位点D97E,D188E、E326D的引物序列,包括:[0023]A97-f:gccattgaggaaaccacct;[0024]A97-r:aggtggtttcctcaatggc;[0025]B188-f:gcggtctgtgaacgcgaagc;[0026]B188-r:gcttcgcgttcacagaccgc;[0027]C326-f:cggatcgacgagttccata;[0028]C326-r:tatggaactcgtcgatccg;[0029]或,引入二个突变位点D97E、D188E的引物序列,包括:[0030]A97-f:gccattgaggaaaccacct;[0031]A97-r:aggtggtttcctcaatggc;[0032]B188-f:gcggtctgtgaacgcgaagc;[0033]B188-r:gcttcgcgttcacagaccgc;

5

CN 106754811 A[0034]

说 明 书

3/6页

或,引入二个突变位点D188E、E326D的引物序列,包括:

[0035]B188-f:gcggtctgtgaacgcgaagc;[0036]B188-r:gcttcgcgttcacagaccgc;[0037]C326-f:cggatcgacgagttccata;[0038]C326-r:tatggaactcgtcgatccg;[0039]或,引入二个突变位点D97E、E326D的引物序列,包括:[0040]C326-f:cggatcgacgagttccata;[0041]C326-r:tatggaactcgtcgatccg;[0042]A97-f:gccattgaggaaaccacct;[0043]A97-r:aggtggtttcctcaatggc。[0044]本发明上述的突变型Tn5转座酶可应用于DNA建库中。[0045]本发明还提供一种利用所述突变型Tn5转座酶在DNA建库过程中进行基因组DNA片段化的反应体系:10~25mM HEPES缓冲液,pH 7.2~7.6;0.1~5mM beta-巯基乙醇;10~80μg/ml牛血清白蛋白;0.1~0.2M谷氨酸钾;0.2~0.5mM MnSO4;0.2~1mM KCl;100~500nM所述突变型Tn5转座酶;50~100ng基因组DNA;0.1~1ng含有19bp转座子序列的接头引物;反应程序:37℃,10min~1h。[0046]进一步,所述含有19bp转座子序列的接头引物包括:转座酶识别序列:AGATGTGTATAAGAGACAG、第一接头序列:AATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTC;第二接头序列:CAAGCAGAAGACGGCATACGAGATGTCTCGTGGGCTCGG。[0047]经测试,与EK/LP Tn5转座酶相比,使用本发明改造后的所述突变型Tn5转座酶进行加接头的测序文库均一性明显提高。[0048]本发明的有益效果:[0049]本发明对现有已改造的EK/LP Tn5转座酶进行降低DNA偏好性的定向改造,具体是改变其中心催化元件核心残基D97、D188、E326,从而通过定点突变改进了Tn5转座酶蛋白序列和构象,提高了Tn5转座酶对成对末端复合物的结合亲和性,基于提高的DNA结合亲和性和催化能力,从而消除了对DNA片段切断的碱基偏好性。本发明对EK/LP Tn5转座酶的中心催化元件残基的双突变,改变了对DNA碱基依赖性的结合而改良打断作用的碱基偏好性。[0050]本发明所提供的突变型Tn5转座酶,改进了Tn5转座酶对DNA靶序列插入的偏好性,显著改善了DNA建库均一性,并使建库结果具有更好的覆盖度,显著改善的建库均一性,可以适当降低数值量,节约测序和分析成本。[0051]本发明所设计的突变型Tn5转座酶的行进性增加,将其应用于DNA建库时设计了相对应的DNA片段化反应体系,对其中盐离子浓度和缓冲液都进行了调整,使反应更可控,更易于根据时间控制打断的片段大小。

附图说明[0052]图1为现有EK/LP Tn5转座酶构建文库的GC偏好性分析结果图。[0053]图2为本发明实施例4中突变型Tn5转座酶构建文库的GC偏好性分析结果图。[0054]图3为本发明实施例7合成的突变型Tn5转座酶构建文库的GC偏好性分析结果图。

6

CN 106754811 A

说 明 书

4/6页

具体实施方式[0055]以下结合具体实施例进一步详细描述本发明的技术方案。[0056]实施例1氨基酸序列如SEQ ID NO.2所示的Tn5转座酶的制备方法,包括如下步骤:[0057]1)构建含编码所述突变型Tn5转座酶的核苷酸序列的载体[0058]利用基因合成的方法,合成包含了需要突变的位点和替换过的碱基的引物序列如下:[0059]A97-f:gccattgaggaaaccacct;[0060]A97-r:aggtggtttcctcaatggc;[0061]B188-f:gcggtctgtgaacgcgaagc;[0062]B188-r:gcttcgcgttcacagaccgc;[0063]C326-f:cggatcgacgagttccata;[0064]C326-r:tatggaactcgtcgatccg;[0065]利用PCR对改造的EK/LP Tn5转座酶基因(其基因序列如SEQ ID NO.1所示)进行扩增,分别以引物A97-f和B188-r,B188-f和C326-r,C326-f和A97-r为引物,在50μl反应体系中,以含有EK/LP Tn5转座酶基因的质粒为模板,10μM的引物各加入2μl,以Phanta Max Super-Fidelity DNA Polymerase(由南京诺唯赞生物科技有限公司生产,Vazyme,货号P505)为DNA聚合酶。扩增条件为95℃ 30s;95℃ 15s;60℃ 15s;72℃ 30s-3min;72℃ 5min;共30个循环。[0066]扩增结束后,在50μl反应体系中直接加入1μl DpnI,37℃恒温孵育2小时,消化原始质粒模板。以1%-1.5%(W/V)琼脂糖凝胶电泳,得到目的条带后切胶回收。将回收产物利用Mut

MultiS Fast Mutagenesis KitV2(由南京诺唯赞生物科技有限公司生

产,Vazyme,货号C215)进行重组反应,37℃恒温孵育0.5小时。[0067]取20μl冷却反应液,加入到100μl B121感受态细胞中,轻弹管壁数下混匀,在冰上放置30min。42℃热激90秒,冰水浴孵育2min。加入500μl LB培养基,37℃孵育10min充分复苏。37℃摇菌45min。取100μl菌液均匀涂布在含有氨苄青霉素的平板上。将平板倒置,于37℃过夜培养。第二天挑取单克隆,测序验证。测序结果表明:本发明合成的突变型Tn5转座酶的核苷酸序列如SEQ NO.3所示,氨基酸序列如SEQ NO.2所示。[0068]实施例2将载体转化宿主细胞得到重组细胞:[0069]将测序验证无误的载体,取10ng以同样转化方法转化到BL21感受态细胞中,涂布在含有氨苄青霉素的LB平板上,37℃过夜培养。第二天挑取单克隆。[0070]实施例3培养并收集重组细胞,提取纯化突变型Tn5酶[0071]具体步骤如下:[0072]将单克隆重组细胞挑入3ml LB液体培养基中,摇培6-8h,然后转接扩大培养至300ml LB液体培养基中,摇培4-6h后,加入IPTG至终浓度为50mmol/L后继续摇培过夜,诱导目的蛋白表达。将300ml菌液分装至50ml离心管中,以5000rpm离心10min收集菌体。每100ml菌液离心后加入10ml洗脱缓冲液(50mmol/L Tris-HCl pH7.9;50mmol/L右旋糖;1mmol/L EDTA)重悬,冰上放置1h;3500rpm离心3min重新收集菌体,加入50ml预裂解缓冲液(洗脱缓冲液加4g/L溶菌酶),室温放置15min;加入50ml裂解缓冲液(10mmol/L Tris-HCl pH7.9;

7

CN 106754811 A

说 明 书

5/6页

50mmol/L KCl;1mmol/L EDTA;1mmol/L PMSF;0.5%Tween-20(V/V);0.5%NP-40(V/V)),剧烈振荡混匀,75℃孵育1h,不时振荡,然后将裂解混合液转移至50ml离心管,4℃5000rpm离心15min,转移上清液至新的离心管中,加入30g硫酸铵,室温迅速混匀。15000rpm离心15min,将蛋白沉淀物重新悬浮至20ml洗脱缓冲液中,在储存缓冲液(50mmol/L Tris-HCl pH7.9;50mmol/L KCl;0.1mmol/L EDTA;0.5mmol/L PMSF;1mmol/L DTT;50%glycerol(V/V)中透析至少12h。透析后,用储存缓冲液1∶1稀释,储存于-80℃。[0073]实施例4突变型Tn5转座酶和EK/LP Tn5转座酶的建库均一性比较[0074]配制以基因组DNA为模板的处理体系,反应体系如下:25mM HEPES缓冲液,pH 7.4;1mM beta-巯基乙醇;50ug/ml牛血清白蛋白;0.1M谷氨酸钾;0.5mM MnSO4;0.5mM KCl;200nM实施例3所得的突变型Tn5转座酶;50ng基因组DNA;1ng含有19bp转座子序列的接头引物。反应程序:37℃30min。含有19bp转座子序列的接头引物包括:转座酶识别序列:AGATGTGTATAAGAGACAG、第一接头序列:AATGATACGGCGACCACCGAGATCTACACXXXXXXXXTCGTCGGCAGCGTC;第二接头序列:CAAGCAGAAGACGGCATACGAGATXXXXXXXXGTCTCGTGGGCTCGG;其中,XXXXXXXX为Index序列。[0075]作为对比例的EK/LP Tn5转座酶进行DNA片段化的反应体系是常规反应体系为:100mM谷氨酸钾,25mM HEPES缓冲液(pH 7.4),50ug/ml牛血清白蛋白,1mM MgCl2,1mM beta-巯基乙醇,200nM Tn5转座酶,25nM DNA模板。[0076]将2份100ng起始EK/LP Tn5转座酶及实施例1-3得到的突变转座酶打断处理过的DNA模板分别利用VAHTS Nano DNA Library Prep Kit for 

(Vazyme,ND601)进

行末端修复和加接头连接,接着用试剂盒中的扩增模块进行文库扩增,得到文库。具体操作见试剂盒说明书。[0077]使用荧光染料Qubit进行文库浓度测定,使用二代测序仪进行60M数据的读取,现有EK/LP Tn5转座酶、实施例1合成的突变型Tn5转座酶构建文库的GC偏好性分析结果分别参见图1、图2,分析数据在基因组上的均一性。[0078]由图1可知,EK/LP Tn5转座酶构建的文库在数据前端均出现明显GC含量波动,表明EK/LP Tn5转座酶对片段化位点的某些碱基具有一定的偏好性。由图2可知,本发明实施例1所提供突变型Tn5转座酶构建的文库前端数据的GC含量波动甚微,说明本发明所述突变型Tn5转座酶片段化位点基本无偏好性。结果显示使用本发明设计的DNA片段化反应体系和实施例1-3所获得的突变型Tn5转座酶进行加接头的实验组文库均一性较使用EK/LP Tn5转座酶的明显提高。[0079]实施例5包含D97E、D188E突变的突变序列如SEQ NO.4所示的突变型Tn5转座酶的制备和性能测试[0080]使用以下两对引物对EK/LP Tn5转座酶进行突变改造,具体实施方法同实施例1-3:[0081]A97-f:gccattgaggaaaccacct;[0082]A97-r:aggtggtttcctcaatggc;[0083]B188-f:gcggtctgtgaacgcgaagc;[0084]B188-r:gcttcgcgttcacagaccgc。[0085]所得突变型Tn5转座酶的核苷酸序列如SEQ NO.4所示,该突变型Tn5转座酶与EK/

8

CN 106754811 A

说 明 书

6/6页

LP Tn5转座酶同时进行DNA片段化处理并进行文库构建,具体同实施例4,其GC偏好性测试数据表明:实施例5所提供的突变型Tn5转座酶构建的文库前端数据的GC含量波动甚微,说明该突变型Tn5转座酶片段化位点基本无偏好性,进行加接头的实验组文库均一性较使用EK/LPTn5转座酶的明显提高。[0086]实施例6包含D188E、E326D突变的突变序列如SEQ NO.5所示的突变型Tn5转座酶的制备和性能测试[0087]使用以下两对引物对EK/LP Tn5转座酶进行突变改造,具体实施方法同实施例1-4。[0088]B188-f:gcggtctgtgaacgcgaagc;[0089]B188-r:gcttcgcgttcacagaccgc;[0090]C326-f:cggatcgacgagttccata;[0091]C326-r:tatggaactcgtcgatccg。[0092]所得突变型Tn5转座酶的核苷酸序列如SEQ NO.5所示,该突变型Tn5转座酶与EK/LP Tn5转座酶同时进行DNA片段化处理并进行文库构建,具体同实施例4,其GC偏好性测试数据表明:实施例6所提供的突变型Tn5转座酶构建的文库前端数据的GC含量波动甚微,说明该突变型Tn5转座酶片段化位点基本无偏好性,进行加接头的实验组文库均一性较使用EK/LP Tn5转座酶的明显提高。[0093]实施例7包含D97E、E326D突变的突变序列如SEQ NO.6所示的突变型Tn5转座酶的制备和性能测试[0094]使用以下两对引物对EK/LP Tn5转座酶进行突变改造,具体实施方法同同实施例1-4。[0095]A97-f:gccattgaggaaaccacct;[0096]A97-r:aggtggtttcctcaatggc;[0097]C326-f:cggatcgacgagttccata;[0098]C326-r:tatggaactcgtcgatccg。[0099]所得突变型Tn5转座酶的核苷酸序列如SEQ NO.6所示,该突变型Tn5转座酶与EK/LP Tn5转座酶同时进行DNA片段化处理并进行文库构建,具体同实施例4,其GC偏好性如图3所示。[0100]由图1、图3可知,实施例7所提供的突变型Tn5转座酶构建的文库前端数据的GC含量波动甚微,说明该突变型Tn5转座酶片段化位点基本无偏好性,进行加接头的实验组文库均一性较使用EK/LP Tn5转座酶的明显提高。[0101]最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围中。

9

CN 106754811 A

序 列 表

1/5页

序 列 表

<110>南京诺唯赞生物科技有限公司

<120>一种突变型Tn5转座酶及其制备方法和应用<160> 6<210>SEQ ID NO. 1<211>1429<212>DNA

<213>人工合成atgataactt ctgctcttca tcgtgcggcc gactgggcta aatctgtgtt ctcttcggcg 60gcgctgggtg atcctcgccg tactgcccgc ttggttaacg tcgccgccca attggcaaaa 120tattctggta aatcaataac catctcatca gagggtagta aagccatgca ggaaggcgct 180taccgatttt accgcaatcc caacgtttct gccgaggcga tcagaaaggc tggcgccatg 240caaacagtca agttggctca ggagtttccc gaactgctgg ccattgagga caccacctct 300ttgagttatc gccaccaggt cgccgaagag cttggcaagc tgggctctat tcaggataaa 360tcccgcggat ggtgggttca ctccgttctc ttgctcgagg ccaccacatt ccgcaccgta 420ggattactgc atcaggagtg gtggatgcgc ccggatgacc ctgccgatgc ggatgaaaag 480gagagtggca aatggctggc agcggccgca actagccggt tacgcatggg cagcatgatg 540agcaacgtga ttgcggtctg tgaccgcgaa gccgatattc atgcttatct gcaggacagg 600ctggcgcata acgagcgctt cgtggtgcgc tccaagcacc cacgcaagga cgtagagtct 660gggttgtatc tgatcgacca tctgaagaac caaccggagt tgggtggcta tcagatcagc 720attccgcaaa agggcgtggt ggataaacgc ggtaaacgta aaaatcgacc agcccgcaag 780gcgagcttga gcctgcgcag tgggcgcatc acgctaaaac aggggaatat cacgctcaac 840gcggtgctgg ccgaggagat taacccgccc aagggtgaga ccccgttgaa atggttgttg 900ctgaccggcg aaccggtcga gtcgctagcc caagccttgc gcgtcatcga catttatacc 960catcgctggc ggatcgagga gttccataag gcatggaaaa ccggagcagg agccgagagg 1020caacgcatgg aggagccgga taatctggag cggatggtct cgatcctctc gtttgttgcg 1080gtcaggctgt tacagctcag agaaagcttc acgccgccgc aagcactcag ggcgcaaggg 1140ctgctaaagg aagcggaaca cgtagaaagc cagtccgcag aaacggtgct gaccccggat 1200gaatgtcagc tactgggcta tctggacaag ggaaaacgca agcgcaaaga gaaagcaggt 1260agcttgcagt gggcttacat ggcgatagct agactgggcg gttttatgga cagcaagcga 1320accggaattg ccagctgggg cgccctctgg taaggttggg aagccctgca aagtaaactg 1380gatggctttc ttgccgccaa ggatctgatg gcgcagggga tcaagatct 1429<210>SEQ ID NO. 2<211>476<212>PRT

<213>人工合成 10  20  30 40 50MITSALHRAA DWAKSVFSSA ALGDPRRTAR LVNVAAQLAK YSGKSITISS

10

CN 106754811 A

序 列 表

2/5页

60 70 80 90  100EGSKAMQEGA YRFIRNPNVS AEAIRKAGAM QTVKLAQDFP ELLAIEETTS 110 120 130 140 150LSYRHQVAEE LGKLGSIQDK SRGWWVHSVL LLEATTFRTV GLLHQEWWMR 160 170 180 190 200PDDPADADEK ESGKWLAAAA TSRLRMGSMM SNVIAVCERE ADIHAYLQDK 210 220  230 240 250LAHNERFVVR SKHPRKDVES GLYLYDHLKN QPELGGYQIS IPQKGVVDKR 260 270 280 290 300GKRKNRPARK ASLSLRSGRI TLKQGNITLN AVLAEEINPP KGETPLKWLL 310 320 330 340 350LTSEPVESLA QALRVIDIYT HRWRIDEFHK AWKTGAGAER QRMEEPDNLE 360 370 380 390 400RMVSILSFVA VRLLQLRESF TPPQALRAQG LLKEAEHVES QSAETVLTPD 410 420 430 440 450ECQLLGYLDK GKRKRKEKAG SLQWAYMAIA RLGGFMDSKR TGIASWGALW 460 470EGWEALQSKL DGFLAAKDLM AQGIKI<210>SEQ ID NO. 3<211>1429<212>DNA

<213>人工合成atgataactt ctgctcttca tcgtgcggcc gactgggcta aatctgtgtt ctcttcggcg 60gcgctgggtg atcctcgccg tactgcccgc ttggttaacg tcgccgccca attggcaaaa 120tattctggta aatcaataac catctcatca gagggtagtg aagccatgca ggaaggcgct 180taccgatttt accgcaatcc caacgtttct gccgaggcga tcagaaaggc tggcgccatg 240caaacagtca agttggctca ggagtttccc gaactgctgg ccattgagga aaccacctct 300ttgagttatc gccaccaggt cgccgaagag cttggcaagc tgggctctat tcaggataaa 360tcccgcggat ggtgggttca ctccgttctc ttgctcgagg ccaccacatt ccgcaccgta 420ggattactgc atcaggagtg gtggatgcgc ccggatgacc ctgccgatgc ggatgaaaag 480gagagtggca aatggctggc agcggccgca actagccggt tacgcatggg cagcatgatg 540agcaacgtga ttgcggtctg tgaacgcgaa gccgatattc atgcttatct gcaggacagg 600ctggcgcata acgagcgctt cgtggtgcgc tccaagcacc cacgcaagga cgtagagtct 660gggttgtatc tgatcgacca tctgaagaac caaccggagt tgggtggcta tcagatcagc 720attccgcaaa agggcgtggt ggataaacgc ggtaaacgta aaaatcgacc agcccgcaag 780gcgagcttga gcctgcgcag tgggcgcatc acgctaaaac aggggaatat cacgctcaac 840gcggtgctgg ccgaggagat taacccgccc aagggtgaga ccccgttgaa atggttgttg 900ctgaccggcg aaccggtcga gtcgctagcc caagccttgc gcgtcatcga catttatacc 960catcgctggc ggatcgacga gttccataag gcatggaaaa ccggagcagg agccgagagg 1020

11

CN 106754811 A

序 列 表

3/5页

caacgcatgg aggagccgga taatctggag cggatggtct cgatcctctc gtttgttgcg 1080gtcaggctgt tacagctcag agaaagcttc acgccgccgc aagcactcag ggcgcaaggg 1140ctgctaaagg aagcggaaca cgtagaaagc cagtccgcag aaacggtgct gaccccggat 1200gaatgtcagc tactgggcta tctggacaag ggaaaacgca agcgcaaaga gaaagcaggt 1260agcttgcagt gggcttacat ggcgatagct agactgggcg gttttatgga cagcaagcga 1320accggaattg ccagctgggg cgccctctgg taaggttggg aagccctgca aagtaaactg 1380gatggctttc ttgccgccaa ggatctgatg gcgcagggga tcaagatct  1429<210>SEQ ID NO. 4<211>1249<212>DNA

<213>人工合成atgataactt ctgctcttca tcgtgcggcc gactgggcta aatctgtgtt ctcttcggcg 60gcgctgggtg atcctcgccg tactgcccgc ttggttaacg tcgccgccca attggcaaaa 120tattctggta aatcaataac catctcatca gagggtagtg aagccatgca ggaaggcgct 180taccgatttt accgcaatcc caacgtttct gccgaggcga tcagaaaggc tggcgccatg 240caaacagtca agttggctca ggagtttccc gaactgctgg ccattgagga aaccacctct 300ttgagttatc gccaccaggt cgccgaagag cttggcaagc tgggctctat tcaggataaa 360tcccgcggat ggtgggttca ctccgttctc ttgctcgagg ccaccacatt ccgcaccgta 420ggattactgc atcaggagtg gtggatgcgc ccggatgacc ctgccgatgc ggatgaaaag 480gagagtggca aatggctggc agcggccgca actagccggt tacgcatggg cagcatgatg 540agcaacgtga ttgcggtctg tgaacgcgaa gccgatattc atgcttatct gcaggacagg 600ctggcgcata acgagcgctt cgtggtgcgc tccaagcacc cacgcaagga cgtagagtct 660gggttgtatc tgatcgacca tctgaagaac caaccggagt tgggtggcta tcagatcagc 720attccgcaaa agggcgtggt ggataaacgc ggtaaacgta aaaatcgacc agcccgcaag 780gcgagcttga gcctgcgcag tgggcgcatc acgctaaaac aggggaatat cacgctcaac 840gcggtgctgg ccgaggagat taacccgccc aagggtgaga ccccgttgaa atggttgttg 900ctgaccggcg aaccggtcga gtcgctagcc caagccttgc gcgtcatcga catttatacc 960catcgctggc ggatcgagga gttccataag gcatggaaaa ccggagcagg agccgagagg 1020caacgcatgg aggagccgga taatctggag cggatggtct cgatcctctc gtttgttgcg 1080gtcaggctgt tacagctcag agaaagcttc acgccgccgc aagcactcag ggcgcaaggg 1140ctgctaaagg aagcggaaca cgtagaaagc cagtccgcag aaacggtgct gaccccggat 1200gaatgtcagc tactgggcta tctggacaag ggaaaacgca agcgcaaaga gaaagcaggt 1260agcttgcagt gggcttacat ggcgatagct agactgggcg gttttatgga cagcaagcga 1320accggaattg ccagctgggg cgccctctgg taaggttggg aagccctgca aagtaaactg 1380gatggctttc ttgccgccaa ggatctgatg gcgcagggga tcaagatct 1429<210>SEQ ID NO. 5<211>1249<212>DNA

<213>人工合成

12

CN 106754811 A

序 列 表

4/5页

atgataactt ctgctcttca tcgtgcggcc gactgggcta aatctgtgtt ctcttcggcg 60gcgctgggtg atcctcgccg tactgcccgc ttggttaacg tcgccgccca attggcaaaa 120tattctggta aatcaataac catctcatca gagggtagtg aagccatgca ggaaggcgct 180taccgatttt accgcaatcc caacgtttct gccgaggcga tcagaaaggc tggcgccatg 240caaacagtca agttggctca ggagtttccc gaactgctgg ccattgagga caccacctct 300ttgagttatc gccaccaggt cgccgaagag cttggcaagc tgggctctat tcaggataaa 360tcccgcggat ggtgggttca ctccgttctc ttgctcgagg ccaccacatt ccgcaccgta 420ggattactgc atcaggagtg gtggatgcgc ccggatgacc ctgccgatgc ggatgaaaag 480gagagtggca aatggctggc agcggccgca actagccggt tacgcatggg cagcatgatg 540agcaacgtga ttgcggtctg tgaacgcgaa gccgatattc atgcttatct gcaggacagg 600ctggcgcata acgagcgctt cgtggtgcgc tccaagcacc cacgcaagga cgtagagtct 660gggttgtatc tgatcgacca tctgaagaac caaccggagt tgggtggcta tcagatcagc 720attccgcaaa agggcgtggt ggataaacgc ggtaaacgta aaaatcgacc agcccgcaag 780gcgagcttga gcctgcgcag tgggcgcatc acgctaaaac aggggaatat cacgctcaac 840gcggtgctgg ccgaggagat taacccgccc aagggtgaga ccccgttgaa atggttgttg 900ctgaccggcg aaccggtcga gtcgctagcc caagccttgc gcgtcatcga catttatacc 960catcgctggc ggatcgacga gttccataag gcatggaaaa ccggagcagg agccgagagg 1020caacgcatgg aggagccgga taatctggag cggatggtct cgatcctctc gtttgttgcg 1080gtcaggctgt tacagctcag agaaagcttc acgccgccgc aagcactcag ggcgcaaggg 1140ctgctaaagg aagcggaaca cgtagaaagc cagtccgcag aaacggtgct gaccccggat 1200gaatgtcagc tactgggcta tctggacaag ggaaaacgca agcgcaaaga gaaagcaggt 1260agcttgcagt gggcttacat ggcgatagct agactgggcg gttttatgga cagcaagcga 1320accggaattg ccagctgggg cgccctctgg taaggttggg aagccctgca aagtaaactg 1380gatggctttc ttgccgccaa ggatctgatg gcgcagggga tcaagatct 1429<210>SEQ ID NO. 6<211>1249<212>DNA

<213>人工合成atgataactt ctgctcttca tcgtgcggcc gactgggcta aatctgtgtt ctcttcggcg 60gcgctgggtg atcctcgccg tactgcccgc ttggttaacg tcgccgccca attggcaaaa 120tattctggta aatcaataac catctcatca gagggtagtg aagccatgca ggaaggcgct 180taccgatttt accgcaatcc caacgtttct gccgaggcga tcagaaaggc tggcgccatg 240caaacagtca agttggctca ggagtttccc gaactgctgg ccattgagga aaccacctct 300ttgagttatc gccaccaggt cgccgaagag cttggcaagc tgggctctat tcaggataaa 360tcccgcggat ggtgggttca ctccgttctc ttgctcgagg ccaccacatt ccgcaccgta 420ggattactgc atcaggagtg gtggatgcgc ccggatgacc ctgccgatgc ggatgaaaag 480gagagtggca aatggctggc agcggccgca actagccggt tacgcatggg cagcatgatg 540agcaacgtga ttgcggtctg tgaccgcgaa gccgatattc atgcttatct gcaggacagg 600ctggcgcata acgagcgctt cgtggtgcgc tccaagcacc cacgcaagga cgtagagtct 660

13

CN 106754811 A

序 列 表

5/5页

gggttgtatc tgatcgacca tctgaagaac caaccggagt tgggtggcta tcagatcagc 720attccgcaaa agggcgtggt ggataaacgc ggtaaacgta aaaatcgacc agcccgcaag 780gcgagcttga gcctgcgcag tgggcgcatc acgctaaaac aggggaatat cacgctcaac 840gcggtgctgg ccgaggagat taacccgccc aagggtgaga ccccgttgaa atggttgttg 900ctgaccggcg aaccggtcga gtcgctagcc caagccttgc gcgtcatcga catttatacc 960catcgctggc ggatcgacga gttccataag gcatggaaaa ccggagcagg agccgagagg 1020caacgcatgg aggagccgga taatctggag cggatggtct cgatcctctc gtttgttgcg 1080gtcaggctgt tacagctcag agaaagcttc acgccgccgc aagcactcag ggcgcaaggg 1140ctgctaaagg aagcggaaca cgtagaaagc cagtccgcag aaacggtgct gaccccggat 1200gaatgtcagc tactgggcta tctggacaag ggaaaacgca agcgcaaaga gaaagcaggt 1260agcttgcagt gggcttacat ggcgatagct agactgggcg gttttatgga cagcaagcga 1320accggaattg ccagctgggg cgccctctgg taaggttggg aagccctgca aagtaaactg 1380gatggctttc ttgccgccaa ggatctgatg gcgcagggga tcaagatct 1429

14

CN 106754811 A

说 明 书 附 图

1/2页

图1

图2

15

CN 106754811 A

说 明 书 附 图

2/2页

图3

16

因篇幅问题不能全部显示,请点此查看更多更全内容