1.本发明涉及核酸测序领域。更具体地,本发明涉及形成用于测序的核酸靶标的模板的领域。
背景技术:2.由于新技术的开发和成本的降低,核酸测序的广泛使用正在增加。目前,流行的高通量单分子测序方法包括illumina平台(illumina,san diego,cal.),ion torrent平台(life technologies,grand island,ny),利用smrt的pacific biosciences平台(pacific biosciences,menlo park,cal.)或利用纳米孔技术的平台,诸如由oxford nanopore technologies(oxford,uk)或roche sequencing solutions(santa clara,cal.)制造的平台。
3.使长距离测序准确的关键是核酸模板的设计。环状模板对于不涉及簇或聚合酶克隆(polony)形成但依赖于形成模板-聚合酶复合物的方法特别有利,在所述环状模板中,相同的模板分子经由相当的长度且多次进行测序。环状模板提供了从同一分子的多个连续读段中生成共有序列的优势。例如,使用生物和固态纳米孔的核酸测序是一个快速发展的领域,参见ameur,et al.(2019)single molecule sequencing:towards clinical applications,trends biotech.,37:72,涉及生物纳米孔us8461854、us10337060或固态纳米孔us10288599、us20180038001、us10364507,或两个电极之间的隧穿结pct/ep2019/066199和us20180217083。需要创新且经济的手段来形成用于单分子测序的环状核酸模板。
技术实现要素:4.本发明包括用于测序的新型结构核酸模板。该结构是具有短单链缺口的双链环(“有缺口的环”)。该结构包括可延伸的3
′
端,可以从该可延伸的端开始测序或复制。本发明进一步包括在测序中使用新模板结构的方法以及制备新模板的方法。该新型模板是通过在双链环的仅一条链中引入切口而制备的。切口由识别其特异性结合序列的切口酶或识别尿嘧啶碱基的糖基化酶与形成单链断裂(切口)的第二种酶组合产生。
5.在一些实施例中,本发明是一种形成有缺口的环状核酸模板的方法,该方法包括:将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸,其中仅衔接子的一条链包括切割位点;接合经衔接的核酸的末端以形成环状的经衔接的核酸;以及使环状的经衔接的核酸与识别切割位点的切割剂接触从而,以去除环状的经衔接的核酸中仅一条链的一部分,由此形成具有环状链和缺口链的有缺口的环状核酸模板。可以通过延伸包括靶标特异性序列和衔接子序列的引物或通过连接法来附接衔接子。衔接子可以包括核酸条形码。
6.在一些实施例中,切割剂为切口核酸内切酶且所述切割位点为切口核酸内切酶识别位点。在其他实施例中,切割剂为尿嘧啶-n-dna糖基化酶且切割位点为含尿苷核苷酸。
7.在一些实施例中,方法进一步包括在形成环状的经衔接的核酸之前对经衔接的核
酸进行扩增的步骤。
8.在一些实施例中,方法进一步包括在形成环状的经衔接的核酸的步骤之后使样品与核酸外切酶接触的步骤。
9.在一些实施例中,通过连接把经衔接的核酸的末端连起来。
10.在一些实施例中,去除环状的经衔接的核酸中仅一条链的一部分的步骤是通过用所述切割剂切割后的热变性。
11.在一些实施例中,环状链在有缺口的环的缺口部分包括引物结合位点,并且该方法进一步包括将引物退火至环状链中的引物结合位点并将引物附接至有缺口的环的缺口链的步骤。引物可以在5
′
部分包括阻断基团。阻断基团可以是捕获部分并且进一步包括通过用捕获分子捕获捕获部分来捕获有缺口的环状核酸模板的步骤。阻断基团可以是防止模板穿入纳米孔的化学基团,诸如发夹结构,或选自聚阳离子基团的大体积基团、大体积基团或碱基修饰的核苷,其中聚阳离子基团或大体积基团附接到核苷的核碱基上。
12.在一些实施例中,有缺口的环的缺口链包括可延伸的3
′
端,并且该方法进一步包括通过延伸可延伸的3
′
端以复制环状链的至少一部分来对靶核酸进行测序。
13.在一些实施例中,本发明是一种对样品中的核酸进行测序的方法,该方法包括形成有缺口的环状核酸模板文库,该方法包括将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸,其中衔接子的仅一条链包括切割位点且衔接子包括引物结合位点;接合经衔接的核酸中的每一者的末端以形成环状的经衔接的核酸;使环状的经衔接的核酸与识别切割位点的切割剂接触,以去除环状的经衔接的核酸中的每一者中仅一条链的一部分,由此形成具有缺口链和环状链的有缺口的环状核酸模板文库,缺口链具有可延伸的3
′
端;延伸可延伸的3
′
端以复制环状链的至少一部分,由此通过边合成边测序法对有缺口的环状核酸模板文库进行测序。该方法可以进一步包括在测序之前富集核酸模板的步骤。在测序期间,将3
′
端延伸以多次复制环状链,并且测序以下步骤:通过比较源自延伸3
′
端以多次复制环状链的多个读段并且任选地还通过比较由本文描述的方法所测序的互补链的共有序列来确定共有序列包括。
14.在一些实施例中,本发明是一种形成有缺口的环状核酸模板文库的方法,该方法包括:将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸,其中衔接子的一条链包括切割位点;将接合经衔接的核酸的末端以形成环状的经衔接的核酸;使环状的经衔接的核酸与识别切割位点的切割剂接触,以去除环状的经衔接的核酸中仅一条链的一部分,以此方式形成有缺口的环状核酸模板文库。
15.在一些实施例中,本发明是一种形成有缺口的环状核酸模板的富集文库的方法,该方法包括:将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸,使经衔接的核酸与具有捕获部分的第一靶标特异性引物杂交;经由捕获部分捕获与第一引物杂交的经衔接的核酸,由此富集靶核酸;使富集的经衔接的靶核酸与包括一个或多个切割位点的序列的第二引物杂交;延伸第二引物从而形成双链的经衔接的核酸,双链的经衔接的核酸仅在一条链上具有一个或多个切割位点;接合经衔接的核酸中的每一者的末端以形成环状的经衔接的核酸;使环状的经衔接的核酸与识别切割位点的切割剂接触,以去除环状的经衔接的核酸中的每一者中仅一条链的一部分,由此形成富集的有缺口的环状核酸模板文库。该方法可进一步包括在捕获捕获部分之前延伸第一引物的步骤。
16.在一些实施例中,本发明是一种形成有缺口的环状核酸模板的富集文库的方法,该方法包括:将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸,使经衔接的核酸与具有捕获部分的第一靶标特异性引物杂交;经由捕获部分捕获与第一引物杂交的经衔接的核酸;使捕获的经衔接的核酸与第二引物杂交,其中第二引物与第一引物杂交至同一链;延伸杂交的第二引物,由此产生双链的经衔接的核酸并且置换包括捕获部分的第一引物;使与第二引物杂交的经衔接的核酸内的衔接子与第三引物杂交,第三引物包括一个或多个切割位点的序列;延伸第三引物从而形成双链的经衔接的核酸,双链的经衔接的核酸具有一个或多个切割位点;接合经衔接的核酸中的每一者的末端以形成环状的经衔接的核酸,双链的经衔接的核酸具有一个或多个切割位点;使环状的经衔接的核酸与识别切割位点的切割剂接触,以去除每个环状的经衔接的核酸中一条链的一部分,由此形成富集的有缺口的环状核酸模板文库。第一引物可以在捕获捕获部分之前延伸。
附图说明
17.图1示出了形成双链有缺口的环的通用方案。
18.图2示出了一种形成双链有缺口的环的方法,其中切口位点是经由加尾的pcr引物引入的酶识别序列。
19.图3示出了一种形成双链有缺口的环的方法,其中切口位点是经由加尾的pcr引物引入的尿嘧啶。
20.图4显示了通过凝胶电泳分析的环形成的产物。
21.图5显示了通过限制性内切酶消化和凝胶电泳分析的有缺口的环形成的产物。
22.图6示出了包括衔接子连接和引物延伸的工作流程。
23.图7示出了一种形成双链有缺口的环的方法,该方法具有额外的靶标富集步骤。
具体实施方式
24.定义
25.除非另有定义,否则本文所用的科学技术术语具有如本领域的普通技术人员通常理解的相同意义。参见,sambrook等人.,molecular cloning,a laboratory manual,第4
th
版,冷泉港实验室出版社(2012)。
26.提供以下定义以促进对本公开的理解。
27.术语“衔接子”是指核苷酸序列,可将其加入另一序列中以便赋予该另一序列以额外的元件和性质。额外的元件包括但不限于:条形码、引物结合位点、捕获部分、标签、二级结构。
28.术语“条形码”是指可被检测和鉴定的核酸序列。条形码通常可以为2个以上且最长可达约50个核苷酸。条形码被设计成与群体中的其他条形码具有至少最小数量的差异。条形码对于样品中的每个分子可以为唯一的,或对样品是唯一的,并且由样品中的多个分子共享。术语“多重标识符”、“mid”或“样品条形码”是指识别样品或样品来源的条形码。就此而言,来自单一来源或样品的所有或基本上所有的mid条形码化的多核苷酸将共享相同序列的mid;而来自不同来源或样品的所有或基本上所有(例如,至少90%或99%)的mid条形码化的多核苷酸将具有不同的mid条形码序列。可以将来自具有不同mid的不同来源的多
核苷酸进行混合并进行并行测序,同时保持mid条形码中编码的样品信息。术语“唯一分子标识符”或“uid”是指识别与其附接的多核苷酸的条形码。通常,uid条形码化的多核苷酸混合物中的所有或基本上所有(例如,至少90%或99%)的uid条形码是唯一的。
29.术语“dna聚合酶”是指从脱氧核苷酸执行模板导向合成多核苷酸的酶。dna聚合酶包括原核pol i、pol ii、pol iii、pol iv和pol v,真核dna聚合酶,古细菌dna聚合酶、端粒酶和反转录酶。术语“热稳定聚合酶”是指对热稳定的酶,它是耐热的,当在高温下经过实现双链核酸变性所需要的时间后,其保留足够的活性以实现随后的多核苷酸延伸反应,并且不会不可逆变性(失活)。热稳定聚合酶用于需要热循环的核酸扩增,例如pcr。
30.在一些实施例中,聚合酶具有适合于合成测序的特性,且特别是适合于如wo2013/188841中描述的利用纳米孔的基于芯片的多核苷酸测序的特性。美国专利号10308918中描述了此类聚合酶的非限制性实例。可用于测序dna的聚合酶的所需特征包括但不限于慢速k
off
(用于修饰的核苷酸)、快速k
on
(用于修饰的核苷酸)、高保真度、低或不存在外切核酸酶活性、链置换活性、较快的k
chem
(用于修饰的核苷酸底物)、提高的稳定性、持续合成能力、测序准确性和长读段长度,即长连续读段。在本发明的上下文中,链置换活性是需要的。链置换活性可以通过us10308918中描述的置换测定以实验方式确定。该测定表征了聚合酶解开和置换双链dna的能力。
31.术语“核酸”或“多核苷酸”是指单链形式或双链形式的脱氧核糖核酸(dna)或核糖核酸(rna)及其聚合物。除非特别限定,否则该术语涵盖包含天然核苷酸的已知类似物的核酸,该天然核苷酸具有与参考核酸相似的结合特性并且以与天然存在的核苷酸相似的方式进行代谢。除非另外指出,否则特定的核酸序列还隐含地涵盖其保守修饰的变体(例如,简并密码子替换)、等位基因、同源基因序、snp和互补序列,以及明确指出的序列。
32.术语“引物”是指与单链模板核酸分子的特定区域结合的寡核苷酸。寡核苷酸可用于经由聚合酶介导的酶促反应启动核酸合成。通常,引物包括少于约100个核苷酸,且优选包括少于约30个核苷酸。靶标特异性引物在杂交条件下与靶标多核苷酸特异性杂交。此类杂交条件可包括但不限于在等温扩增缓冲液中(20mm的tris-hcl,10mm的(nh4)2so4)、50mm的kcl、2mm的mgso4、0.1%的20、25℃下ph为8.8)在约40℃至约70℃的温度下进行杂交。除了靶标结合区域外,引物可以具有附加区域,通常位于5
′‑
部分。附加区域可以包括通用引物结合位点或条形码。任何其他序列或序列元件都可以经由5
′
尾(有时称为5
′
柄)引入。引物还可用于除链合成以外的目的,例如,借助与核酸分子中的特定位点杂交将元件引入核酸分子中。
33.术语“样品”是指包括核酸分子的任何生物样品,通常包括dna或rna。样品可以是组织、细胞或其提取物,或者可以是核酸分子的纯化样品。术语“样品”是指任何含有或假定含有靶核酸的组合物。使用术语“样品”并不一定意味着在存在于样品中的核酸分子中存在靶标序列。该样品可以为包括从个体分离的组织或液体的样本,例如,皮肤、血浆、血清、脊髓液、淋巴液、滑液、尿液、泪液、血液细胞、器官和肿瘤,也指从取自个体的细胞建立的体外培养物的样品,包括福尔马林固定石蜡包埋组织(ffpet)和自其分离的核酸。样品也可包括不含细胞的材料,诸如含有无细胞dna(cfdna)或循环肿瘤dna(ctdna)的不含细胞的血液级分(fraction)。样品可以从非人类受试者或从环境中收集。
34.术语“靶标”或“靶标核酸”是指样品中的目标核酸。样品可能包含多个靶标以及每
个靶标的多个拷贝。
35.术语“通用引物”是指可以与通用引物结合位点杂交的引物。通用引物结合位点可以是通常以非靶标特异性方式添加到靶标序列的天然或人工序列。
36.测序工作流程的关键方面是核酸模板结构和配置。在目前可用的测序方法和仪器中,有几种依赖或最适合环状核酸模板。产生拓扑环状核酸结构的一种常用方法涉及将茎-环(“哑铃状”)衔接子附接到线性核酸片段的末端(参见us8153375)。本文公开了一种新型结构,其包括具有单链区(缺口)的双链环,在本文中可互换地称为有缺口的环或双链有缺口的环。
37.本发明包括对来自样品的靶核酸进行测序。在一些实施例中,该样品获自受试者或患者。在一些实施例中,该样品可包括例如通过活检而获自该受试者或患者的固体组织或实体肿瘤的片段。所述样品还可包括体液(例如尿液、痰、血清、血浆或淋巴、唾液、痰、汗液、泪液、脑脊液、羊水、滑液、心包液、腹膜液、胸膜液、囊液、胆汁、胃液、肠液或粪便样品)。样品可以包括全血或其中可能存在正常细胞或肿瘤细胞的血液级分。在一些实施例中,该样品,特别是液体样品可包括无细胞材料,诸如无细胞dna或rna,包括无细胞肿瘤dna或肿瘤rna。在一些实施例中,该样品是无细胞样品,例如,存在无细胞肿瘤dna或肿瘤rna的无细胞血源性样品。在其他实施例中,样品是培养样品,例如,培养物或者含有或疑似含有来源于培养物中的细胞或培养物中存在的感染源的核酸的培养物上清液。在一些实施例中,该感染源为细菌、原生动物、病毒或支原体。
38.靶标核酸是样品中可能存在的目标核酸。每个靶标的特征在于其核酸序列。本发明能够检测一种或多种rna或dna靶标。在一些实施例中,dna靶标核酸是基因或基因片段(包括外显子和内含子)或基因间区域,并且rna靶标核酸是靶标特异性引物与之杂交的转录本或转录本的一部分。在一些实施例中,该靶标核酸包括遗传性变体的基因座,例如,多态性,包括单核苷酸多态性或变型(snv的snp),或导致例如基因融合的基因重排。在一些实施例中,靶标核酸包括生物标志物,即基因,该基因的变体与疾病或病症相关。例如,靶核酸可以选自于2015年9月10日递交的美国专利申请序列号14/774,518中描述的疾病相关标志物组合。此类组合可作为avenio ctdna分析试剂盒(罗氏测序解决方案公司,普莱森顿,加州)提供。在其他实施例中,靶标核酸具有特定生物体的特征并有助于识别生物体,或者具有病原生物体的特征,例如药物敏感性或耐药性。在其他实施例中,该靶标核酸具有人受试者的独特特征,例如,界定该受试者的独特hla或kir基因型的hla或kir序列的组合。在其他实施例中,靶标核酸是体细胞序列,例如代表免疫球蛋白(包括igg、igm和iga免疫球蛋白)或t细胞受体序列(tcr)的重排免疫序列。在又一应用中,靶标是存在于母体血液中的胎儿序列,包括胎儿疾病或病症或与妊娠相关的母体病症的特征的胎儿序列。例如,靶标可能是zhang等人((2019)non-invasive prenatal sequencing for multiple mendelian monogenic disorders using circulating cell-free fetal dna,nature med.25(3):439)描述的一种或多种常染色体或x连锁疾病。
39.在一些实施例中,靶标核酸是rna(包括mrna、微小rna、病毒rna)。在其他实施例中,靶标核酸是包括细胞dna的dna或包括循环肿瘤dna(ctdna)的无细胞dna(cfdna)。靶标核酸可以以短形式或长形式存在。可以将更长的靶标核酸片段化。在一些实施例中,靶核酸是天然片段化的,例如,包括循环细胞游离dna(cfdna)或化学降解的dna,诸如在化学保存
的或古老样品中发现的一种。
40.在一些实施例中,本发明包括核酸分离步骤。通常,可以使用任何提取含有dna或rna的分离核酸的方法。可以使用基于溶液或基于固相的核酸提取技术从组织、细胞、液体活检样品(包括血液或血浆样品)提取基因组dna或rna。核酸提取可包含基于洗涤剂的细胞裂解、核蛋白质变性,以及任选地去除污染物。从保藏样品中提取核酸还可以包括脱蜡步骤。基于溶液的核酸提取方法可以包括盐析法、或者有机溶剂或离液剂法。固相核酸提取方法可以包括但不限于二氧化硅树脂法、阴离子交换法或磁性玻璃颗粒和顺磁珠(kapa纯珠、罗氏测序解决方案公司,普莱森顿,加州)或ampure珠(贝克曼库尔特,布雷亚市,加州。)
41.典型的提取方法包含裂解样品中存在的组织材料和细胞。从裂解的细胞中释放的核酸可以与存在于溶液或柱或膜中的固体支持物(珠或颗粒)结合,其中核酸可以经历一个或多个洗涤步骤以从样品中去除包括蛋白质、脂质及其片段在内的污染物。最后,结合的核酸可以从固体支持物、柱或膜中释放,并存储在相应的缓冲液中直到准备进一步处理。根据是分离dna还是rna,可以使用适当的核酸酶或核酸酶抑制剂来优先分离仅一种类型的核酸。如果要分离dna和rna,则在核酸分离和纯化过程中可以不使用核酸酶和任选地使用核酸酶抑制剂。
42.在一些实施例中,输入dna或输入rna需要进行片段化。在此类实施例中,rna可以通过热和例如镁的金属离子组合来片段化。在一些实施例中,在镁存在下将样品加热至85
°‑
94
°
℃持续1-6分钟。(kapa rna hyperprep试剂盒,kapa生物,威尔明顿,马萨诸塞州)。dna可以通过物理手段进行片段化,例如超声,使用可获得的仪器(covaris,沃本马萨诸塞州)或酶的手段(kapa片段化酶试剂盒,kapa生物)。
43.在一些实施例中,分离的核酸用dna修复酶处理。在一些实施例中,dna修复酶包括具有5
′‑3′
聚合酶活性和3
′‑5′
单链核酸外切酶活性的dna聚合酶、将5
′
磷酸盐添加到dsdna分子的多核苷酸激酶以及在dsdna分子的3
′
末端添加单个da碱基的dna聚合酶。末端修复/a加尾试剂盒是可获得的,例如kapa文库制备、包括kapa hyper prep和kapa hyperplus(kapa生物,威明顿市,马萨诸塞州)的试剂盒。
44.在一些实施例中,dna修复酶靶向分离的核酸中的受损碱基。在一些实施例中,样品核酸是来自保藏样品的部分受损dna,例如福尔马林固定石蜡包埋(ffpet)样品。碱基的脱氨作用和氧化作用会导致测序过程中错误的碱基读段。在一些实施例,用尿嘧啶n-dna糖基化酶(ung/udg)和/或8-氧代鸟嘌呤dna糖基化酶处理受损dna。
45.在一些实施例中,本发明利用衔接子核酸。衔接子可以通过平端连接或粘性末端连接添加到核酸中。在一些实施例中,可以通过单链连接添加衔接子。在一些实施例中,衔接子分子为在体外合成的人工序列。在其他实施例中,衔接子分子是在体外合成的天然存在的序列。在其他实施例中,衔接子分子为分离的天然存在的分子或分离的非天然存在的分子。
46.在通过连接添加衔接子的情况下,衔接子寡核苷酸可以在末端具有突出端或平端以与靶核酸连接。在一些实施例中,衔接子包括平端,靶核酸的平端连接可以施加到所述平端。靶核酸可以是平端的或可以通过酶处理(例如,“末端修复”)而成为平端。在其他实施例中,平端的dna经历a加尾,其中单个a核苷酸被添加到一个或两个平端的3
′
端。本文所描述的衔接子被制成具有从平端延伸的单个t核苷酸以促进核酸和衔接子之间的连接。用于执
行衔接子连接的可商购试剂盒包括avenio ctdna文库制备试利盒、或kapa hyperprep和hyperplus试剂盒(roche sequencing solutions,pleasanton,cal.)。在一些实施例中,衔接子连接的dna可以从过量的衔接子和未连接的dna分离。
47.在一些实施例中,衔接子含有一种或多种本文所述的新元件,包括切口核酸内切酶识别序列或脱氧尿嘧啶。衔接子可以进一步包括诸如通用引物结合位点(包括测序引物结合位点)、条形码序列(包括样品条形码(sid)或独特的分子条形码或标识符(uid或umi))的特征。在一些实施例中,衔接子包括所有上述特征,而在其他实施例中,一些特征是在衔接子连接后通过延伸含有上述一些元件的加尾的引物而添加的。
48.衔接子还可包括捕获部分。捕获部分可以是能够与另一个捕获分子特异性相互作用的任何部分。捕获部分-捕获分子对包括抗生物素蛋白(链霉抗生物素蛋白)-生物素、抗原-抗体、磁性(顺磁性)颗粒-磁体或寡核苷酸-互补寡核苷酸。捕获分子可以与固体支持物结合,使得其上存在捕获部分的任何核酸被捕获在固体支持物上并与样品或反应混合物的其余部分分离。在一些实施例中,捕获分子包括用于第二捕获分子的捕获部分。例如,衔接子中的捕获部分可以是与捕获寡核苷酸互补的核酸序列。捕获寡核苷酸可以被生物素化,从而可以在链霉抗生物素蛋白磁珠上捕获经衔接的核酸-捕获寡核苷酸杂合物。
49.在一些实施例中,本发明利用条形码。检测单个分子通常需要分子条形码,诸如美国专利号7,393,665、8,168,385、8,481,292、8,685,678和8,722,368中所描述的。唯一分子条形码是短人工序列,其通常在体外操作的最初步骤中添加到患者样品中的每个分子上。所述条形码标记了分子及其子代。所述唯一分子条形码(uid)有多种用途。条形码允许跟踪样品中的每个单个核酸分子,以评估例如患者的血液中循环肿瘤dna(ctdna)分子的存在和数量,以便在不进行活检的情况下检测和监测癌症(newman,a.,等人.,(2014)an ultrasensitive method for quantitating circulating tumor dna with broad patient coverage,nature medicine doi:10.1038/nm.3519)。
50.条形码可以是在样品被混合(多重化)的情况下用于鉴定样品来源的多重样品id(mid)。条形码也可以作为唯一的分子id(uid),用于鉴定每个原始分子及其子代。条形码也可以是uid和mid的组合。在一些实施例中,将单个条形码用作uid和mid。在一些实施例中,每个条形码包括预定义序列。在其他实施例中,条形码包括随机序列。在本发明的一些实施例中,条形码的长度在约4-20个碱基之间,从而将96个到384个不同的衔接子添加到人类基因组样品中,每个衔接子具有不同的相同条形码对。普通技术人员会认识到条形码的数量取决于样品的复杂性(即,唯一靶标分子的预期数量),并且将能够为每个实验创建合适数量的条形码。
51.唯一分子条形码也可用于分子计数和纠正测序错误。单个靶分子的整个子代都用相同的条形码标记,并形成条形码家族。不被带条形码家族的所有成员共享的序列变异被作为伪像丢弃而不是真突变。条形码还可用于位置去重(positional deduplication)和靶标量化,因为整个家族代表原始样品中的单个分子(newman,a.,等人.,(2016)integrated digital error suppression for improved detection of circulating tumor dna,nature biotechnology 34:547)。
52.在一些实施例中,多个衔接子中的uid的数量可以超过多个核酸中的核酸数量。在一些实施例中,多个核酸中的核酸数量超过多个衔接子中的uid的数量。
53.在一些实施例中,本发明进一步包括在测序期间防止模板穿入纳米孔的结构和方法。这对于利用纳米孔但不涉及将任何核酸穿入纳米孔的测序方法特别有利。(参见例如us8461854)。
54.在该实施例中,该方法包括将防止穿入结构插入如本文所述形成的有缺口的环的缺口部分中的步骤。具体地,寡核苷酸引物可以与缺口中的结合位点结合。引物的结合位点借助存在于衔接子中而被并入有缺口的环状核酸模板中。(参见图1、图2和图3,尤其是图7)。
55.在一些实施例中,通过连接添加到核酸模板的衔接子包括引物结合位点。在其他实施例中,通过连接添加到核酸模板的两个衔接子中的每一个包括引物结合位点的一部分,使得在环化后,在环状模板中形成完整的引物结合位点。
56.在一些实施例中,通过引物延伸添加到核酸模板的衔接子包括引物结合位点。例如,引物之一可以包括引物结合位点。在其他实施例中,用于引物延伸的两个引物中的每一个都包括引物结合位点的一部分,使得在引物延伸和环化后,在环状模板中形成完整的引物结合位点。
57.与引物结合位点退火的引物可以例如通过连接来附接到有缺口的核酸模板中的缺口链上。引物在5
′
端包括穿入封阻结构(threading blocker structure)。在引物退火和连接后,有缺口的核酸模板中的缺口链在5
′
端包括穿入封阻结构。
58.在一些实施例中,阻断结构为生物素(图2,右下,图3,右下)。
59.在其他实施例中,阻止模板链穿入纳米孔的阻断结构为发夹结构。合适的发夹结构的实例已经在与2019年11月15日提交的美国临时申请序列号62/936264中描述,标题为“在测序期间防止核酸模板穿过纳米孔的结构”。
60.在其他实施例中,阻止模板链穿入纳米孔的阻断结构是附接到引物的5
′
端并且选自聚阳离子基团、大体积基团或碱基修饰的核苷的化学部分,其中聚阳离子基团或大体积基团附接到核苷的核碱基上,参见例如于2020年2月6日提交的美国临时申请序列号62/971078,标题为“减少模板穿入纳米孔的组合物”。
61.在一些实施例中,本发明包括涉及线性或指数扩增的扩增步骤。扩增可以是等温的或涉及热循环。在一些实施例中,扩增是指数的并且涉及pcr。在一些实施例中,基因特异性引物用于扩增。在其他实施例中,将通用引物结合位点添加至靶核酸,例如,通过连接包括通用引物结合位点的衔接子。所有衔接子连接的核酸具有相同的通用引物结合位点并且可以用同一组引物进行扩增。使用通用引物的扩增循环的数量可以较低,但也可以为10个、20个或高达约30个或更多个循环,这取决于后续步骤所需的产物量。由于使用通用引物的pcr降低了序列偏倚,因此无需为了避免扩增偏倚而限制扩增循环数。
62.在一些实施例中,本发明涉及扩增步骤,例如,在连接衔接子之前或之后,或在延伸5
′
加尾(“手柄”)引物之前或之后。扩增引物可以是靶标特异性的。靶标特异性引物包括与靶标中的序列互补的至少一部分。如果存在额外的序列,诸如条形码、第二引物结合位点或核酸酶识别位点,它们通常位于引物的5
′
部分。在其他实施例中,引物是通用的,例如,可以扩增样品中的所有核酸,而与靶序列无关。通过延伸具有通用引物结合位点的引物或通过连接具有通用引物结合位点的衔接子,通用引物与添加到样品中的核酸的通用引物结合位点退火。
63.如本文所述,引物也可用作捕获探针以富集靶核酸。术语引物和探针可以互换使用以指定在某些条件下与其靶标结合的短寡核苷酸。如本文所公开的(图6),具有捕获部分的寡核苷酸可用于通过保留捕获的所需核酸或通过消耗捕获的不需要的核酸来富集靶核酸。
64.在一些实施例中,本发明是如本文所述形成的靶核酸文库。该文库包括双链核酸分子,该双链核酸分子包括存在于原始样品中的核酸靶标。文库的核酸分子在靶核酸序列的一端或两端进一步包括本文所述的新型衔接子。文库的核酸可以包括额外的元件,诸如条形码和引物结合位点。在一些实施例中,额外的元件存在于衔接子中并通过衔接子连接添加到文库的核酸中。在其他实施例中,一些或所有额外的元件存在于扩增引物中并且在衔接子连接之前通过引物的延伸添加到文库的核酸中。扩增可以是线性的(仅包括一轮延伸)或指数的,例如聚合酶链反应(pcr)。在一些实施例中,一些额外的元件通过引物延伸添加,而其余额外的元件通过衔接子连接添加。
65.例如,美国专利号9476095、9260753、8822150、8563478、7741463、8182989和8053192中描述了衔接子和扩增引物用于将额外的元件引入待测序的核酸文库中的效用。
66.在一些实施例中,本发明进一步包括富集所需的靶核酸的步骤。根据本文所述的新文库形成方法,可以在形成文库之前富集所需的核酸。或者,富集可以在eh文库形成之后,即在文库的分子上进行。
67.在一些实施例中,该方法利用靶标特异性寡核苷酸探针(例如,捕获探针)库。可以通过差减法进行富集,在这种情况下,捕获探针与包括核糖体rna(rrna)或大量表达的基因(例如珠蛋白)的大量不需要的序列互补。在减去的情况下,不需要的序列被捕获探针捕获并从靶核酸混合物或核酸文库中去除并丢弃。例如,捕获探针可以包括可以在固体支持物上捕获的结合部分。
68.在其他实施例中,富集是捕获及保留,在这种情况下,捕获探针与一个或多个靶序列互补。在这种情况下,靶序列被捕获探针从靶核酸混合物或核酸文库中捕获并保留,而溶液的剩余部分被丢弃。
69.为了富集,捕获探针可以在溶液中游离或固定在固体支持物上。例如,可以通过美国专利9,790,543中描述的方法产生和扩增探针。探针还可以包含结合部分(例如,生物素)并且能够捕获在固体支持物(例如,含有支撑材料的抗生物素蛋白或链霉抗生物素蛋白)上。
70.在一些实施例中,富集是通过引物延伸靶标富集(pete)。美国申请系列号14/910,237、15/228,806、15/648,146和国际申请系列号pct/ep2018/085727中描述了多个版本的pete。
71.简而言之,引物延伸靶标富集(pete)涉及用包括捕获部分的第一靶标特异性引物捕获核酸并捕获捕获部分从而富集靶核酸。任何额外的靶标特异性或衔接子特异性引物与富集的靶核酸杂交。在其他实施例中,pete涉及通过杂交和延伸包括捕获部分的第一引物并捕获捕获部分从而富集靶核酸,使第二靶标特异性引物与捕获的核酸杂交,延伸第二靶标特异性引物,从而置换第一靶标特异性引物的延伸产物并进一步富集靶核酸,从而捕获核酸。
72.富集可以利用捕获部分。捕获部分可以是能够与另一个捕获分子特异性相互作用
的任何部分。捕获部分-捕获分子对包括抗生物素蛋白(链霉抗生物素蛋白)-生物素、抗原-抗体、磁性(顺磁性)颗粒-磁体或寡核苷酸-互补寡核苷酸。捕获分子可以与固体支持物结合,使得其上存在捕获部分的任何核酸被捕获在固体支持物上并与样品或反应混合物的其余部分分离。在一些实施例中,捕获分子包括用于第二捕获分子的捕获部分。例如,捕获部分可以是与捕获寡核苷酸(捕获分子)互补的寡核苷酸。捕获寡核苷酸可以被生物素化并捕获在链霉抗生物素蛋白磁珠上。
73.在一些实施例中,通过捕获捕获部分和将衔接子连接的靶核酸与样品中未连接的核酸分离来富集衔接子连接的核酸。
74.在一些实施例中,与底部衔接子链的3
′
端杂交的第三寡核苷酸用作测序引物或扩增引物。在一些实施例中,第三寡核苷酸的延伸产物通过捕获部分被捕获。延伸产物的捕获将延伸产物与未连接的样品核酸分离,并且任选地与不具有捕获部分的靶核酸链分离。
75.在一些实施例中,衔接子的茎部分包括提高捕获寡核苷酸解链温度的经修饰的核苷酸,例如5-甲基胞嘧啶、2,6-二氨基嘌呤、5-羟基丁炔基-2
′‑
脱氧尿苷、8-氮杂-7-去氮杂鸟苷、核糖核苷酸、2
′
o-甲基核糖核苷酸或锁核酸。在另一方面,捕获寡核苷酸被修饰以抑制通过核酸酶(例如硫代磷酸核苷酸)进行的消化。
76.在一些实施例中,本发明包括中间的纯化步骤。例如,任何未使用寡核苷酸(诸如过量引物和过量衔接子)被去除,例如通过选自凝胶电泳、亲和层析和尺寸排阻层析的尺寸选择法。在一些实施例中,可以使用来自贝克曼库尔特(布雷亚市,加州)的固相可逆固定化(spri)来执行尺寸选择。在一些实施例中,捕获部分(图2)用于捕获和分离衔接子连接的核酸与未连接的核酸或来自模板链的引物延伸产物。
77.在一些实施例中,通过核酸外切酶消化从反应混合物中去除未反应的线性核酸,例如引物、探针衔接子或未连接的模板核酸。在一些实施例中,用t7核酸外切酶、t5核酸外切酶、λ核酸外切酶或核酸外切酶i、v或viii消化用于去除未反应的线性寡核苷酸和未环化的(线性)双链的经衔接的核酸的组合。
78.本发明包括形成适合于通过单分子测序仪(诸如进行合成测序法的纳米孔测序仪)进行测序的模板的方法。该方法包括形成具有环状链和有缺口的链的有缺口的环状模板。在一些实施例中,该方法包括将衔接子附接至双链核酸的一端或两端,使得所得的双链的经衔接的核酸仅在其中一条链上具有切割位点。(图1,顶部)。例如,可以通过延伸具有靶标特异性3
′
部分或随机3
′
部分的引物和包括衔接子序列的5
′‑“
手柄”来添加衔接子序列(图2,左上和图3,左上)。正向引物可包括切口酶识别位点,而反向引物包括识别位点的反向互补物。在切割位点是脱氧尿嘧啶的实施例中,仅正向和反向引物之一包括一个或多个脱氧尿嘧啶。使用耐尿嘧啶聚合酶能够在每轮扩增中使用含du的引物。(图3,顶部中间)。
79.在一些实施例中,具有切割位点的衔接子通过连接添加至靶核酸。在一些实施例中,使用联合策略:将含有引物结合位点的衔接子连接至靶核酸。将包括具有一个或多个切口位点的5
′
手柄的引物与适应的核酸杂交并延伸以形成仅在一条链上具有切口位点的核酸。(图6)
80.在引入切割位点后,双链经衔接的分子自环化以形成环,其中仅一条链具有一个或多个切割位点。(图1,中间,图2,右上,图3,右上。)在一些实施例中,自环化是通过双链经衔接的分子的两端的连接进行。在一些实施例中,双链经衔接的分子中两条链的5
′
端磷酸
化以发生连接。
81.在一些实施例中,双链经衔接的分子在环化之前扩增。
82.在一些实施例中,从反应混合物中除去非环化的双链经衔接的分子。在一些实施例中,通过仅对线性(非环状)核酸敏感的外切核酸酶处理来完成去除。(图1,中间,图2,左下,图3,左下)。在其他实施例中,环状和线性分子基于它们的物理特性分离,例如电泳迁移速度或通过尺寸分离或尺寸排阻色谱柱的速度。
83.在一些实施例中,切割位点是切口核酸内切酶的识别位点。例如,一些异二聚体限制性内切酶的小亚基表现为序列特异性dna切口酶,且仅切割识别位点的一条链。xu,et al.(2007)discovery of natural nicking endonucleases nb.bsrdi and nb.btsi and engineering of top-strand nicking variants from bsrdi and btsi,nar 35:4608。此后发现或设计了具有不同识别序列的其他切口酶并且可商购获得(new england biolabs,ipswich,mass.)。在本发明的上下文中,在制造商建议的条件下,将仅在一条链中具有切口酶位点的双链的经衔接的核酸与相应的切口酶在合适的缓冲液中孵育,以实现仅在环状双链经衔接的分子的一条链中切割和产生一个或多个切口。(图1,底部,图2,左下)。
84.在其他实施例中,切割位点仅以脱氧尿苷的形式存在于衔接子的一条链中。在一些实施例中,含尿嘧啶的衔接子连接至靶核酸的至少一端,使得尿嘧啶仅存在于环状双链经衔接的分子的一条链中。在其他实施例中,通过延伸包括尿嘧啶的引物来添加含尿嘧啶衔接子。在一些实施例中,含尿嘧啶的引物序列由耐尿嘧啶的聚合酶复制,例如dna聚合酶(new england biolabs,ipswich,mass.)。(图3,左上)。
85.可以用尿嘧啶-n-dna糖基化酶(ung或udg)从环状双链经衔接的分子的一条链中切除尿嘧啶碱基。该酶会留下一个脱碱基位点,这会导致磷酸二酯键断裂,从而产生切口。在温度升高和(或)存在胺化合物的情况下,有利于形成切口。也可以通过用识别无碱基位点的核酸内切酶(例如核酸内切酶viii)处理引入切口。将糖基化酶和核酸内切酶活性结合在单一制剂中的酶试剂是市售的(例如,酶,new england biolabs)。
86.该方法进一步包括在环状双链经衔接的分子的一条链中的一个或多个切口的位点处形成间隙的步骤。在一些实施例中,最外侧切割位点之间的距离为约45个碱基,但长度也可为约10、20、30、40、50或60个碱基或介于两者之间的任何数量。切割位点的数量为约每10个碱基一个或任何容纳切割酶识别位点大小的类似距离。(图2,右上,图3,右上)。切割位点的放置导致双链环状核酸中的一条链中出现多个切口(糖-磷酸骨架中的单链断裂)。(图2,左下,图3,左下)。两个切口之间的核酸链片段可以从双链环状核酸解离,在双链环状核酸的一条链中留下缺口。(图1,底部,图2,底部中心,图3,底部中心)在一些实施例中,由切口产生的片段通过在适当的缓冲液中升高温度与环状双链经衔接的分子分离。在一些实施例中,由切口引起的片段的变性通过与能够与要去除的片段杂交的过量寡核苷酸的竞争来促进。
87.在一些实施例中,该方法进一步包括将穿入阻断结构插入到有缺口的环状核酸模板分子的缺口中。环状链面向缺口的部分可以包括引物结合位点。然后,该方法进一步包括将寡核苷酸引物退火或杂交到有缺口的环的缺口中的引物结合位点的步骤。引物可以连接到有缺口的环中的缺口链上,从而将引物连接到有缺口的环的一条链上。(图2,右下,图3,右下)。引物在5
′
端(自由端,未连接到有缺口的环的链)包括有利的结构或修饰。在一些实
施例中,修饰是捕获部分,例如生物素。(图2,右下,图3,右下)。在一些实施例中,该方法进一步包括通过用捕获分子捕获捕获部分来捕获有缺口的环状核酸模板。
88.在一些实施例中,引物的5
′
端修饰是防止模板穿入纳米孔的化学基团,诸如聚阳离子基团、大体积基团或碱基修饰的核苷,其中聚阳离子基团或大体积基团附接到核苷的核碱基上。在一些实施例中,防止模板穿入纳米孔的基团是由引物的5
′
端形成的发夹结构。
89.虽然双链有缺口的核酸模板中的缺口链的5
′
端可以是游离的或可能被捕获分子或阻止穿入纳米孔的结构封闭,但在双链有缺口的核酸模板中的缺口链的3
′
端是可延伸的。在一些实施例中,该方法进一步包括在双链有缺口的核酸模板中延伸缺口链的3
′
端,从而通过边合成边测序(sbs)方法对核酸模板进行测序的步骤。
90.在一些实施例中,该方法进一步包括在测序之前通过经由sie排除柱或亲和柱浓缩核酸来富集有缺口的环状核酸模板。
91.在一些实施例中,在边合成边测序(sbs)过程期间对环状核酸链多次读取。环状链序列的多个读段用于确定没有或基本上没有测序错误的环状链的共有序列。
92.在一些实施例中,根据本发明形成的模板或模板文库富集了一种或多种靶核酸。可以通过保留进行富集,即,捕获并保留所需序列,而不保留未捕获的序列并任选地丢弃。在其他实施例中,富集是通过消耗来进行的,即从样品或反应混合物中捕获和去除不需要的序列,而需要的序列留在样品中并保留。
93.如图7所示,在一些实施例中,形成有缺口的核酸模板富集文库的方法包括将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸的步骤。接下来,使经衔接的核酸与具有捕获部分的第一靶标特异性引物杂交。经由捕获部分捕获与引物杂交的经衔接的核酸,从而富集靶经衔接的核酸。在一些实施例中,捕获部分通过附接在固体支持物上的配体捕获。具有捕获的靶核酸的固体支持物与含有剩余经衔接的核酸的液相分离。在分离之后,将捕获的核酸作为富集的核酸引入另一反应混合物中。
94.富集的核酸与包括一个或多个切割位点的序列的第二引物接触。在一些实施例中,第二引物的3
′
部分包括靶标特异性序列或与经衔接的核酸中的衔接子杂交的序列。第二引物的5
′
部分包括具有一个或多个切割位点的序列。在一些实施例中,第二引物的5
′
部分包括切口酶的识别序列形式的切割位点。在一些实施例中,引物中的切割位点是含尿嘧啶的核苷酸,例如尿嘧啶或脱氧尿嘧啶。在这个实施例中,第二引物的5
′
部分是可选的。相反,第二个引物的靶标特异性部分中的胸腺嘧啶被尿嘧啶取代。
95.延伸第二引物以形成仅在一条链上具有一个或多个切割位点的双链的经衔接的核酸。接下来,将双链的经衔接的核酸的末端连接以形成环状的经衔接的核酸,其中仅在一条链中具有切割位点。接下来,用识别切割位点的切割剂切割环状的经衔接的核酸以去除环状的经衔接的核酸中的每一者中仅一条链的一部分,由此形成富集的有缺口环状核酸模板文库。
96.在一些实施例中,根据本发明形成的模板或模板文库通过不同方法富集了一种或多种靶核酸。形成有缺口的核酸模板富集文库的方法的该实施例包括将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸的步骤。接下来,使经衔接的核酸与具有捕获部分的第一靶标特异性引物杂交。任选地,杂交引物被延伸以复制靶核酸链。经由捕获部分捕获与引物杂交的经衔接的核酸,从而富集靶经衔接的核酸。在一些实施例中,捕
获部分通过附接在固体支持物上的配体捕获。具有捕获的靶核酸的固体支持物与含有剩余经衔接的核酸的液相分离。在分离之后,将捕获的核酸引入另一反应混合物中。
97.使具有富集的靶核酸的反应混合物与在第一靶标特异性引物内部与靶核酸杂交的第二靶标特异性引物接触。然后,该方法包括延伸杂交的第二引物,从而产生双链的经衔接的核酸并置换包括捕获部分的第一引物(或第一引物延伸产物)并将靶核酸和第二引物延伸产物释放到溶液中从而进一步富集溶液中的靶核酸。
98.接下来,该方法包括使包括一个或多个切割位点的序列的第三引物与富集的核酸杂交。在一些实施例中,第三引物的3
′
部分包括靶标特异性或衔接子特异性序列,并且第三引物的5
′
部分包括一个或多个切割位点。在一些实施例中,切割位点是切口酶的识别序列。在一些实施例中,切割位点是尿嘧啶或脱氧尿嘧啶,其可以放置在引物的靶标特异性或衔接子特异性部分或引物的额外的5
′
部分中。
99.接下来,延伸第三引物形成具有一个或多个切割位点的双链的经衔接的核酸;并且每个双链的经衔接的核酸的末端自接合以形成环状的经衔接的核酸。用识别切割位点的切割剂切割环状的经衔接的核酸以去除每个环状的经衔接的核酸中一条链的一部分,从而形成富集的有缺口环状核酸模板文库。
100.如本文所述形成的核酸和核酸文库或其扩增子可以进行核酸测序。测序可通过本领域已知的任何方法实施。尤其有利的是利用纳米孔的高通量单分子测序。在一些实施例中,如本文所述形成的核酸和核酸文库通过涉及穿过生物纳米孔(us10337060)或固态纳米孔(us10288599、us20180038001、us10364507)的方法进行测序。在其他实施例中,测序涉及将标签穿过纳米孔。(us8461854)或任何其他现有或未来利用纳米孔的dna测序技术。
101.其他适合的高通量单分子测序技术。包括依诺米那hiseq平台(illumina,san diego,cal.)、离子激流平台(life technologies,grand island,ny)、利用smrt的太平洋生物科学平台(pacific biosciences,menlo park,cal.),或者利用纳米孔技术的平台诸如牛津纳米孔技术公司(oxford,uk)或罗氏测序解决方案公司(santa clara,cal.)制造的那些平台,和任何其他现有的或将来的dna测序技术,该技术涉及或不涉及通过合成进行测序。测序步骤可利用平台特异性测序引物。可以将这些引物的结合位点引入扩增步骤中使用的扩增引物的5
′‑
部分。如果条形码分子文库中不存在引物位点,则可以执行引入此类结合位点的额外短扩增步骤。在一些实施例中,测序步骤涉及序列分析。在一些实施例中,该分析包括序列比对步骤。在一些实施例中,比对用于从多个序列(例如,具有相同条形码(uid)的多个序列)中确定共有序列。在一些实施例中,条形码(uid)用于从具有相同条形码(uid)的多个序列中确定共有序列。在其他实施例中,使用条形码(uid)来消除伪像,即,存在于一些但并非全部具有相同条形码(uid)的序列中的变异。源自pcr误差或测序误差的此类伪像可以被消除。
102.在一些实施例中,通过定量样品中每个条形码(uid)的序列的相对数量,可以定量样品中的每个序列的数量。每个uid代表原始样品中的单个分子,且计数与每个序列变体相关的不同uid可以确定每个序列在原始样品中的比例。本领域技术人员将能够确定为确定共有序列所必需的序列读出的数量。在一些实施例中,为了准确的定量结果,每个uid(“序列深度”)都需要读取相关数量。在一些实施例中,期望的深度是每个uid 5-50次读取。
103.在一些实施例中,测序步骤进一步包括通过共有序列确定进行错误校正的步骤。
biolabs)进行消化。使用qiaquick柱纯化带切口的dsdna环。
114.在退火缓冲液(100mm trishcl、500mm nacl、10mm edta)中存在100倍摩尔过量的竞争寡核苷酸(表1)的情况下,通过两轮热变性去除dna切口产生的片段。每轮热变性后,使用qiaquick柱纯化dna。
115.通过用ii型限制酶bsrdi(new england biolabs)消化来测试形成有缺口的环的效率。消化产物在1%tae琼脂糖上电泳,并在200v下电泳20分钟。结果在图4中示出。正如预测的那样,dsdna环被bsrdi切割,而有缺口的dna没有被bsrdi切割。
116.根据制造商的方案,使用连接酶缓冲液中的连接酶将生物素化的穿入阻断引物连接到有缺口的环的缺口中。用qiaquick柱纯化连接产物,并通过bsrdi消化和凝胶电泳分析。如图4所示,带有连接寡核苷酸的有缺口的ds环被bsrdi部分消化。
117.在生物纳米孔仪器上对带有连接的穿入阻断剂的有缺口的环进行测序。结果准确率为84%,中值处理长度在5.6kb和6kb之间。
118.实施例2.通过连接衔接子制备有缺口的环状模板
119.在此示例中,第一步是连接包括nb.bsrdi的衔接子。如实例1所述进行形成有缺口的ds环的后续步骤,包括“手柄pcr”、自连接、外切核酸酶处理、nb.bsrdi消化、缺口形成和连接阻断寡核苷酸的步骤。
技术特征:1.一种形成有缺口的环状核酸模板的方法,所述方法包括a.将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸,其中所述衔接子的仅一条链包含切割位点;b.接合所述经衔接的核酸的末端以形成环状的经衔接的核酸;c.使所述环状的经衔接的核酸与识别所述切割位点的切割剂接触,以去除所述环状的经衔接的核酸中仅一条链的一部分,由此形成具有环状链和缺口链的有缺口的环状核酸模板。2.根据权利要求1所述的方法,其中所述衔接子通过延伸包含靶标特异性序列和衔接子序列的引物附接。3.根据权利要求1所述的方法,其中所述衔接子通过连接进行附接。4.根据权利要求1所述的方法,其中所述衔接子包含核酸条形码。5.根据权利要求1所述的方法,其中所述切割剂为切口核酸内切酶且所述切割位点为所述切口核酸内切酶识别位点。6.根据权利要求1所述的方法,其进一步包括在形成所述环状的经衔接的核酸之前对所述经衔接的核酸进行扩增的步骤。7.根据权利要求1所述的方法,其中所述切割剂为尿嘧啶-n-糖基化酶且所述切割位点为含尿苷核苷酸。8.根据权利要求1所述的方法,其进一步包括在形成所述环状的经衔接的核酸的所述步骤之后将所述样品与核酸外切酶接触的步骤。9.根据权利要求1所述的方法,其中接合所述经衔接的核酸的所述末端是通过连接进行。10.根据权利要求1所述的方法,其中在步骤c.中,去除所述环状的经衔接的核酸中仅一条链的所述部分是通过用所述切割剂切割后的热变性进行。11.根据权利要求1所述的方法,其中所述环状链在所述有缺口的环的所述缺口部分包含引物结合位点。12.根据权利要求1所述的方法,其中所述有缺口的环的所述缺口链包含可延伸的3
′
端。13.根据权利要求1至12所述的方法,其进一步包括通过延伸所述可延伸的3
′
端以复制所述环状链的至少一部分来对靶核酸进行测序。14.一种对样品中的核酸进行测序的方法,所述方法包括,a.形成有缺口的环状核酸模板文库,所述方法包括i.将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸,其中所述衔接子的仅一条链包含切割位点且所述衔接子包含引物结合位点;ii.接合所述经衔接的核酸中的每一者的末端以形成环状的经衔接的核酸;iii.使所述环状的经衔接的核酸与识别所述切割位点的切割剂接触,以去除所述环状的经衔接的核酸中的每一者中仅一条链的一部分,由此形成具有缺口链和环状链的有缺口的环状核酸模板文库,所述缺口链具有可延伸的3
′
端;b.延伸所述可延伸的3
′
端以复制所述环状链的至少一部分,由此通过边合成边测序法对所述有缺口的环状核酸模板文库进行测序。
15.一种形成有缺口的环状核酸模板文库的方法,所述方法包括:a.将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸,其中所述衔接子的一条链包含切割位点;b.接合所述经衔接的核酸中的每一者的末端以形成环状的经衔接的核酸;c.使所述环状的经衔接的核酸与识别所述切割位点的切割剂接触,以去除所述环状的经衔接的核酸中的每一者中仅一条链的一部分,以此方式形成有缺口的环状核酸模板文库。16.一种形成有缺口的环状核酸模板的富集文库的方法,所述方法包括:a.将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸,b.使经衔接的核酸与具有捕获部分的第一靶标特异性引物杂交;c.经由所述捕获部分捕获与所述第一引物杂交的所述经衔接的核酸,由此富集靶核酸;d.将所述富集的经衔接的靶核酸与包含一个或多个切割位点的序列的第二引物杂交;e.延伸所述第二引物以形成双链的经衔接的核酸,所述双链的经衔接的核酸仅在一条链上具有一个或多个切割位点;f.接合所述双链的经衔接的核酸中的每一者的末端以形成环状的经衔接的核酸;g.使来自步骤f.的所述环状的经衔接的核酸与识别所述切割位点的切割剂接触,以去除所述环状的经衔接的核酸中的每一者中仅一条链的一部分,由此形成富集的有缺口的环状核酸模板文库。17.一种形成有缺口的环状核酸模板的富集文库的方法,所述方法包括:a.将衔接子附接到样品中的双链核酸的至少一个末端从而形成经衔接的核酸,b.使经衔接的核酸与具有捕获部分的第一靶标特异性引物杂交;c.经由所述捕获部分捕获与所述第一引物杂交的所述经衔接的核酸;d.使所述捕获的经衔接的核酸与第二引物杂交,其中第二引物与所述第一引物一样杂交至同一链;e.延伸所述杂交的第二引物,由此产生双链的经衔接的核酸并且置换包含所述捕获部分的所述第一引物;f.使与所述第二引物杂交的所述经衔接的核酸内的衔接子与第三引物杂交,所述第三引物包含一个或多个切割位点的序列;g.延伸所述第三引物从而形成双链的经衔接的核酸,所述双链的经衔接的核酸具有一个或多个切割位点;h.接合所述双链的经衔接的核酸中的每一者的末端以形成环状的经衔接的核酸,所述双链的经衔接的核酸具有一个或多个切割位点;i.使来自步骤h.的所述环状的经衔接的核酸与识别所述切割位点的切割剂接触,以去除所述环状的经衔接的核酸中的每一者中一条链的一部分,由此形成富集的有缺口的环状核酸模板文库。
技术总结本发明公开了一种新型核酸模板结构以及制备和使用所述结构的方法。所述结构由具有单链缺口的双链环组成。环状的有缺口的结构包括可延伸的末端,可从所述可延伸的末端开始复制或测序。或测序。
技术研发人员:A
受保护的技术使用者:豪夫迈
技术研发日:2021.03.10
技术公布日:2022/11/1