本发明属于检测方法,涉及一种实时荧光定量pcr的不依赖阈值的客观反应荧光信号超过本底线时所经历的循环数,即cp值的获得方法、系统及其应用。
背景技术:
1、聚合酶链式反应(polymerase chainreaction,pcr)是应用最广泛的分子生物学技术之一。美国appliedbiosystems公司在此基础上首先推出了实时荧光定量pcr(real-time quantitative polymerase chainreaction,real-time qpcr),该技术与设备实现了pcr从定性到定量的飞跃。
2、qpcr仪器的设计原理和测定方法是:靶序列在pcr过程中经过一个“拆链-退火-延伸”的循环,理论上可以使靶序列的量增加一倍,经过n个循环后靶序列可达2n倍。在pcr反应体系中加入荧光基团,实时检测每一轮循环的荧光信号强度,通过测定反应管内的荧光信号达到预设的检测信号值时所经历的循环数,根据标准曲线可获得未知样品的初始模板量。预设的荧光检测信号值,即为阈值(threshold),可人为设定在指数扩增阶段任意位置上,一般取指数上升早期;循环过程中扩增产物产生的荧光信号值达到阈值的所经历的循环数,为阈值循环数,即ct(cycle thresholdvalue)。显而易见,对于特定反应,ct值的水平与荧光阈值设定有关。目前,abi公司以及领域内其它公司,如罗氏等产出的荧光定量pcr仪,普遍采用ct值作为测定指标。根据pcr反应原理,在荧光信号的指数增长期,pcr产物量的对数值与起始模板量之间存在线性关系,仪器程序会根据给定的阈值输出反应管的ct值。通过ct与已知模板拷贝数(log2)的标准线可以定量计算未知样品中起始的靶序列拷贝数。
3、市面上实时荧光定量pcr仪器多采用高度依赖于阈值设定的ct测定方法,而阈值设定存在主观性,从而影响到ct的准确性。进而,针对特定检测对象建立检测方法的过程中,需要进行不同引物和/或不同反应条件的优选,且一般在同一批次反应中进行,鉴于不同反应体系的扩增效率差异巨大,若阈值未能设定在所有待测体系的指数上升早期,则不能客观评价不同反应体系的扩增效率。如图1所示,同一批次实验推荐阈值约为78.78,此阈值与图中所示的扩增曲线本底相交,ct为7.36,不符合实际扩增情况,对阈值进行人为设定,500时阈值仍于本底相交,需提高至3000以上才符合“交于指数上升早期”的要求,此时ct值约为32.87。从反应原理分析,在扩增过程中可能存在的非特异反应,如非靶酶促反应、引物二聚体等会影响扩增曲线的本底甚至整个扩增过程,此时则需要对阈值设定进行反复摸索,甚至难以找到合适的荧光阈值用于客观评价同一批次的所有反应。
4、针对这一问题,领域里存在零星基于数据驱动策略的方法,用于进行不依赖阈值设定的“ct值”计算。例如,基于原始数据的非线性回归拟合得到理查兹曲线的拐点切线与基线的交点(a new real-time pcr method to overcome significant quantitativeinaccuracy due to slight amplification inhibition,michele guescini,bmcbioinformatics,9:326,2008),计算二阶导数的最大值相切于扩增曲线的线与基线的交叉点(中国发明专利201380051030.9)。这类交点计算方案有一个共同的特点,它们通常采用扩增曲线的所有数据,不对数据进行取舍,而实际上,扩增曲线上的异常数据,例如经常存在于曲线开端的扬起点,会很大程度上影响基线导致未知模板浓度计算不精确。
技术实现思路
1、为了解决现有技术存在的不足,本发明的目的是提供一种实时荧光定量pcr的不依赖阈值的客观反应荧光信号超过本底线时所经历的循环数,即cp(pointofintersection cycle)值的获得方法,包括基于数据驱动策略的以最小二乘法进行数据筛选和线性拟合的回归法和基于经验规则对数据进行取舍和线性回归的快速取点法。
2、现有的多数计算方案通常直接采用扩增曲线的所有数据,不对数据进行取舍,本发明中依照经验,将扩增曲线上的异常数据点,例如将经常存在于曲线开端的扬起点剔除,可避免基线导致的未知模板浓度计算不精确的问题。
3、扩增过程中靶序列按规律指数扩增,荧光信号超出本底后即进入指数上升阶段。将扩增曲线中指数上升线与本底线的交点(point ofintersection)所对应的循环数定为cp,用于反映初始模板量,修正传统ct设定高度依赖阈值主观设定的不足。相比现有技术中的一阶导法、二阶导法,本发明方法能够更有效地剔除数据噪音,且计算方法简单实用。结合标准曲线,cp法能够准确地得到特定反应的初始模板量。
4、本发明提供了一种实时荧光定量pcr的cp值获得方法,用于准确获取pcr反应的初始模板量,所述方法包括基于数据驱动策略的以最小二乘法进行数据筛选和线性拟合的回归法和基于经验规则对数据进行取舍和线性回归的快速取点法;所述回归法是指在pcr反应扩增过程中,使用最小二乘法分别获得扩增曲线上的本底段的函数和上升段的函数,将两个函数对应的两条直线的交点的x轴坐标作为cp值;所述快速取点法是指分别通过选取扩增曲线上的本底段和上升段的部分点,分别获得指数上升段的函数和本底段的函数,将两个函数对应的两条直线的交点的x轴坐标即为cp值。
5、荧光定量pcr反应产生的扩增曲线大致可以分成三个阶段:荧光背景信号阶段,荧光信号指数扩增阶段和平台期。在扩增曲线荧光背景信号阶段,扩增的荧光信号被荧光背景信号所掩盖,接近一条直线,又称为“基线”,所述本底段便位于扩增曲线基线段。当扩增产物的荧光信号高于荧光背景信号时,扩增曲线开始起峰,进入指数期增长期,pcr产物量的对数值与起始模板量之间存在线性关系,在此阶段可进行定量分析,所述上升段位于指数扩增段。当pcr扩增后期,扩增产物已不再呈指数级的增加,荧光信号增长趋缓,形成一个平台期。
6、具体地,所述基于数据驱动策略的以最小二乘法进行数据筛选和线性拟合的回归法包括以下步骤:
7、步骤一、设定并进行pcr扩增反应,获得关于△rn~cycle的扩增曲线,并剔除由外部光噪导致的扩增曲线开端异常扬起的点;所述△rn表示pcr产物荧光信号值;所述cycle表示扩增圈数;
8、步骤二、遍历步骤一中获得的扩增曲线,选择扩增曲线上连续三个点中△rn差值(△rnk+2-△rnk)最大的曲线段,所述连续三个点记为ak、ak+1和ak+2,利用最小二乘法对选择出来的所述△rn差值最大的连续三个点(ak、ak+1和ak+2)进行线性回归参数的计算,获得上升线函数y=b2x+a2;上升线函数中,x为扩增圈数(cycle),y为△rn值;
9、步骤三、利用扩增曲线中从第一个点开始到步骤二中选择的三个点中的第一个点之间的所有点,即利用扩增曲线中[1,k)范围内的点,对[1,k)中的每一个点ai,取ai+0,ai+1,ai+2,……,ai+j共(j+1)个点,计算每一个点ai取出的(j+1)个点的皮尔逊相关系数r2;其中i的取值范围为[1,k-1],j的取值范围为[4,9],且i+j<k;在获得的所有点的皮尔逊相关系数r2中,选择皮尔逊相关系数r2最大的一个所对应的imax和jmax,利用最小二乘法在[imax,imax+jmax]之间的点进行线性回归,获得本底线函数y=b1x+a1;本底线函数中,x为扩增圈数(cycle),y为△rn值;
10、步骤四、利用步骤二中获得的上升线函数和步骤三中获得的本底线函数,获得cp值;所述cp值=(a1-a2)/(b2-b1)。
11、步骤一中,△rn~cycle的扩增曲线直观展示了反应体系中检出的荧光信号强度与扩增圈数之间的关系,同批次实验中含有不同初始浓度的标准品进行扩增反应时,以标准品拷贝数的对数值为横坐标,以测得的ct(本发明中为cp)为纵坐标,可绘制出线性关系的标准曲线。对未知样品进行扩增后,将测得的ct(本发明中为cp)代入公式即可计算出未知样品的拷贝数。
12、步骤二中,所述连续三个点记作ak、ak+1、ak+2,获得的上升线函数中,x表示扩增圈数cycle,y表示pcr产物荧光信号值△rn值;所述以最小二乘法获得的线性回归方程即上升线函数中,其中的自变量x为扩增圈数,因变量y为pcr产物荧光信号值△rn,自变量和因变量的组数n为3。
13、步骤三中,扩增曲线中从第一个点开始到步骤二中选择的三个点中的第一个点之间的范围记作[1,k),i的取值范围为[1,k-1],j的取值范围为[4,9],且i+j<k;获得的本底段函数中,x表示扩增圈数cycle,y表示△rn值;所述最小二乘法获得的线性回归方程即本底线函数中,其中的自变量x为扩增圈数,因变量y为pcr产物荧光信号值△rn,自变量和因变量的组数n为j。
14、具体地,所述基于经验规则对数据进行取舍和线性回归的快速取点法包括如下步骤:
15、步骤i、设定并进行pcr扩增反应,获得关于△rn~cycle的扩增曲线,并剔除由外部光噪导致的扩增曲线开端异常扬起的点;所述△rn表示pcr产物荧光信号值;所述cycle表示扩增圈数;
16、步骤ii、步骤i生成的扩增曲线指数上升段中,遍历所有的连续n个点,取斜率最大的n个点拟合获得指数上升线,所述n个点记作(ak,ak+1,……,ak+n);计算获得n个点的斜率公式为上升线函数y=b2x+a2,作为上升线lineb;n的取值范围为[3,5];
17、步骤iii、扩增曲线的指数本底段中,遍历所有的连续m个点,所述m个点记作(ad,ad+1,……,ad+m),d+m到步骤ii组成上升线起始点ak的前a个点为止,即(d+m)小于(k-a),m的取值范围为[5,15],同时d的选取范围应考虑环境光噪对本底线的影响,避免扩增曲线开端扬起,利用最小二乘法对m个点进行线性回归拟合后获得本底线函数y=b1x+a1,作为本底线linea;在本底段的选择过程中,位于指数上升段的点应剔除,即a的取值不小于4,a的取值优选为7;步骤i生成的扩增曲线中上升段的前4个点已处于指数扩增阶段,不纳入本底线的计算中;优选地,m的取值为10。
18、步骤iv、利用步骤ii中获得的上升线函数和步骤iii中获得的本底线函数,获得cp值;所述cp值=(a1-a2)/(b2-b1)。
19、步骤i中,△rn~cycle的扩增曲线直观展示了反应体系中检出的荧光信号强度与扩增圈数之间的关系,当同批次实验中含有不同初始浓度的标准品进行扩增反应,能够获得标准曲线并计算未知样品的初始浓度。
20、本发明还提供了一种实现上述cp值获得方法的实时荧光定量pcr的cp获得系统,所述系统包括:数据导出模块、数据输入模块、数据范围选择模块、函数计算模块、cp值计算模块、cp值输出模块;
21、所述数据导出模块用于导出通过荧光定量pcr仪软件获得的包括pcr扩增曲线数据的文件;
22、所述数据输入模块用于将所述包括pcr扩增曲线数据的文件输入到数据范围选择模块中;
23、所述数据范围选择模块用于从输入的pcr扩增曲线数据中筛选去除pcr扩增曲线起始位置翘起的数据点;
24、所述函数计算模块用于利用回归法和/或快速取点法分别计算获得扩增曲线上上升段和本底段的回归直线;
25、所述cp值计算模块用于计算上升段函数和本底段函数的交叉点,交叉点的x值为cp值;
26、所述cp输出模块用于输出计算获得的cp值。
27、在实际使用过程中,本发明的cp值获得方法具体可以包括如下步骤:
28、回归法:
29、步骤(1)、数据导出,自荧光定量pcr仪软件中导出含有pcr扩增曲线数据的文件,由多个数据点组成,每个数据点对应一个坐标,其中x轴为扩增循环圈数(cycle),y轴为某一圈循环时pcr产物的荧光信号值(△rn);
30、步骤(2)、数据输入,输入步骤(1)导出的文件;
31、步骤(3)、数据范围选择,若pcr扩增曲线的起始位置有明显翘起的几点数据,应自行去除;
32、步骤(4)、上升线函数计算,扩增曲线中取△rn差值最大的连续三点,利用最小二乘法对该三点进行线性回归,获得上升线函数;
33、步骤(5)、本底线函数计算,计算数据的皮尔逊相关系数r2;选择r2最大的一个所对应的数据,利用最小二乘法进行线性回归,获得本底线函数;
34、步骤(6)、cp值计算,计算上升线函数和本底线函数的交叉点,该交叉点的x值就为cp;
35、步骤(7)、cp值输出,该流程最终输出数据为cp值,即循环数。
36、快速取点法:
37、步骤a、数据导出,自荧光定量pcr仪软件中导出含有pcr扩增曲线数据的文件,由多个数据点组成,每个数据点对应一个坐标,其中x轴为扩增循环圈数(cycle),y轴为某一圈循环时pcr产物的荧光信号值(△rn);
38、步骤b、数据输入,输入步骤a导出的文件;
39、步骤c、数据范围选择,若pcr扩增曲线的起始位置有明显翘起的几点数据,应自行去除;
40、步骤d、上升线函数计算,上升段中取斜率最大的n个点拟合进行线性回归,获得上升线函数;
41、步骤e、本底线函数计算,剔除上升线前7个数据点,该7个点前连续的10个点进行线性回归,获得本底线函数;
42、步骤f、cp值计算,计算上升线函数和本底线函数的交叉点,该交叉点的x值就为cp;
43、步骤g、cp值输出,该流程最终输出数据为cp值,即循环数。
44、本发明还提供了上述cp判定方法/cp值获得方法、cp获得系统在pcr扩增反应初始模板量获得中的应用。
45、本发明的有益效果包括:本发明应用中,将扩增曲线中指数上升线与本底线的交点(point ofintersection)所对应的循环数定为cp,修正传统ct设定高度依赖阈值主观设定的不足,客观反应荧光信号超过本底线时所经历的循环数,对起始靶基因进行精确定量。
46、本发明应用中,cp值是唯一且客观反应真实初始模板量的数字,可以用于分析同批次中不同反应条件的扩增,并且相互比较。
47、本发明应用中,cp值获得法相比现有技术中的一阶导法、二阶导法,本发明方法能够更有效地剔除数据噪音,且计算方法简单实用。
1.一种实时荧光定量pcr的cp值获得方法,其特征在于,用于客观且准确获取pcr反应的初始模板量,所述方法包括基于数据驱动策略的以最小二乘法进行数据筛选和线性拟合的回归法和基于经验规则对数据进行取舍和线性回归的快速取点法;
2.如权利要求1所述的cp值获得方法,其特征在于,所述基于数据驱动策略的以最小二乘法进行数据筛选和线性拟合的回归法包括如下步骤:
3.如权利要求2所述的cp值获得方法,其特征在于,步骤一中,所述△rn表示pcr产物荧光信号值;所述cycle表示扩增圈数;△rn~cycle的扩增曲线直观展示了反应体系中检出的荧光信号强度与扩增圈数之间的关系,当同批次实验中含有不同初始浓度的标准品进行扩增反应,能够获得标准曲线并计算未知样品的初始浓度。
4.如权利要求2所述的cp值获得方法,其特征在于,步骤二中,所述连续三个点记作ak、ak+1、ak+2,获得的上升线函数中,x表示扩增圈数cycle,y表示pcr产物荧光信号值△rn值;所述以最小二乘法获得的线性回归方程即上升线函数中,其中的自变量x为扩增圈数,因变量y为pcr产物荧光信号值△rn,自变量和因变量的组数n为3。
5.如权利要求2所述的cp值获得方法,其特征在于,步骤三中,扩增曲线中从第一个点开始到步骤二中选择的三个点中的第一个点之间的范围记作[1,k),i的取值范围为[1,k-1],j的取值范围为[4,9],且i+j<k;获得的本底段函数中,x表示扩增圈数cycle,y表示△rn值;所述最小二乘法获得的线性回归方程即本底线函数中,其中的自变量x为扩增圈数,因变量y为pcr产物荧光信号值△rn,自变量和因变量的组数n为j。
6.如权利要求1所述的cp值获得方法,其特征在于,所述基于经验规则对数据进行取舍和线性回归的快速取点法包括如下步骤:
7.如权利要求6所述的cp值获得方法,其特征在于,步骤i中,所述△rn表示pcr产物荧光信号值;所述cycle表示扩增圈数;△rn~cycle的扩增曲线直观展示了反应体系中检出的荧光信号强度与扩增圈数之间的关系,当同批次实验中含有不同初始浓度的标准品进行扩增反应,能够获得标准曲线并计算未知样品的初始浓度。
8.如权利要求6所述的cp值获得方法,其特征在于,步骤ii中,所述n的取值范围为[3,5];
9.一种实现如权利要求1-8之任一项所述cp值获得方法的实时荧光定量pcr的cp获得系统,其特征在于,所述系统包括:数据导出模块、数据输入模块、数据范围选择模块、函数计算模块、cp值计算模块、cp值输出模块;
10.如权利要求1-8之任一项所述的cp值获得方法和/或如权利要求9所述的cp获得系统在pcr扩增反应初始模板量获得中的应用。
