1.本发明涉及石油化工领域,尤其涉及一种石油化工中样品非线性指标的模型建立方法及装置。
背景技术:2.在我国社会经济持续高速发展的背景之下,不同领域为了适应社会的发展也在不断提出新的要求。在石油化工领域,目前的评判标准不仅体现在能源的需求量上,同时还要求具有更高质量的油品。对于石化领域的产品检测,传统型产品质量检测技术大多数采用化验室分析人员直接进行采样分析,这导致分析时效性差、分析成本高,很难达到现代化检测领域中提出的要求,满足石化企业相应的日常生产需求。
3.在整个油品生成过程中,包括原油样品进厂、各套工艺装置及其相应的工艺管线、油品储运单元等,如果能够实现油品全周期的快速分析检测,不仅可为石化企业节约成本,同时也能够更为高效的指导石化企业的日常生产。石油化工生产过程中,我国一直提倡的政策是节能环保,对于原料油,中间馏分油以及最终的成品油,油品的分析检测正变得日趋重要,为了能够满足石化领域生产过程中的实际需求,目前已经研发出了大量快速分析检测仪,包括各种红外分析仪,拉曼分析仪,色谱分析仪,核磁共振分析仪等,在此基础上,其相应的分析学科,化学计量学也得到了长足的发展。
4.化学计量学中对于石化样品的定量分析多是采用多元校正算法中的偏最小二乘法(pls),这也是目前化学计量学中的主流算法,但其缺陷也较为明显,pls作为一种线性方法,很难对诸如粘度之类的非线性指标建立一个精确的模型。另一方面,一部分开发人员尝试通过引入人工神经网络(ann)来建立非线性指标模型,虽然该方法在一定程度上解决了非线性指标建模测不准的问题,但是由于ann建模过程往往需要大量的数据进行网络的训练,同时ann模型过拟合问题严重,在对训练数据之外的样本,其偏差浮动剧烈。
技术实现要素:5.本发明提供了一种石油化工中样品非线性指标的模型建立方法及装置,以解决现有石化物料中非线性指标模型存在准确性不高的技术问题。
6.为了解决上述技术问题,本发明提供了一种石油化工中样品非线性指标的模型建立方法,包括:
7.获取待建模指标的多个待处理样品数据;其中,所述待处理样品数据包括若干个光谱数据图以及各所述光谱数据图对应的化验分析数据;
8.通过预设的若干个谱图处理方法对所述待处理样品数据进行处理,得到若干个数据集;其中,所述数据集包括校正集和验证集,且每个数据集包括若干个处理后的待处理样品数据;
9.根据预设的kpls建模方法,从所述若干个校正集中筛选出最小均偏差值最小的第一数据集;
10.根据所述第一数据集和所述预设的初始模型,分别构建pls模型、ann模型、kpls模型和ga-kpls模型;其中,所述初始模型包括pls初始模型、ann初始模型、kpls初始模型;所述ga-kpls模型是由已构建的kpls模型经过ga算法优化后而获得;
11.根据所述验证集,分别对所述pls模型、所述ann模型、所述kpls模型和所述ga-kpls模型进行预测验证,并根据验证结果,从已验证的模型中确定待建模指标的图谱预测模型。
12.本发明采用的是一种石油化工中样品非线性指标的模型建立方法,首先获取待建模指标的多个待处理样品数据,包括若干个光谱数据图以及各所述光谱数据图对应的化验分析数据,通过对多个所述待处理样品数据进行建模,能够提高检测的准确性,接着通过预设的若干个谱图处理方法对所述待处理数据进行处理得到若干个数据集,所述若干个数据集包括校正集和验证集,所述预设的谱图处理方法众多,种类更丰富,更能找到合适的谱图处理方法,提高检测的精准度,然后通过所述预设的kpls方法构建模型找出从所述若干个校正集中筛选出最小均偏差值最小的第一数据集,通过该步骤能够找到处理效果最好的谱图处理方法,为接下来构建模型减少需要处理的数据,接着构建pls模型、ann模型、kpls模型和ga-kpls模型,所述ga-kpls模型是由已构建的kpls模型经过ga算法优化后而获得,利用ga算法对kpls模型参数进行优化,能够进一步加强模型的精准度,最后将所述验证集输入到所述pls模型、所述ann模型、所述kpls模型和所述ga-kpls模型中进行预测验证,筛选出最小均偏差值最小的模型作为待建模样品的图谱预测模型。相比于现有技术对某一非线性指标固定使用一种模型构建方法,本发明从多个已构建模型中筛选出符合待构建指标的图谱预测模型,能够适配非线性指标的自身特性,从而提高该待构建指标的检测准确性。
13.作为优选例子,在所述获取待建模指标的多个待处理样品数据,具体包括:
14.根据待采集样品的种类,确定分析仪的类型,并通过确定类型的分析仪,对若干个待采集样品进行扫描,获得每个待采集样品各自对应的光谱数据图;
15.其中,每个待采集样品对应一个所述待建模指标的化验分析数据,且各待采集样品的种类相同。
16.本发明通过分析所述待采集样品的种类选择合适的分析仪进行扫描,不仅能快速的得到所述待采集样品的光谱数据,而且根据所述待采集样品的特点选择适合的分析仪,能更加准确的得到所述待采集样品的光谱数据,同时对所述待采集样品采用标准方法及传统的分析仪器对所述待采集样品进行分析获得所述待采集样品的化验分析数据集,可以为后续评价该模型提供标准。
17.作为优选例子,在所述通过预设的若干个谱图处理方法对所述待处理数据进行处理得到若干个数据集,具体包括:
18.根据kennard-stone算法,对若干个待处理数据进行分类,分为待处理校正集和待处理验证集。
19.本发明利用kennard-stone算法将获得的所述若干个待处理数据分为校正集和验证集两部分,一方面是为了方便后续进行样本的查找,节省时间成本,另一方面是所述校正集可以用来后续构建模型,所述验证集用来评价模型。
20.作为优选例子,在所述通过预设的若干个谱图处理方法对所述待处理数据进行处理,得到若干个数据集,具体包括:
21.通过n种不同的谱图预处理方法,分别对所述待处理校正集和待处理验证集进行独立处理,获得n个校正集和n个验证集,从而获得n个数据集,其中n为大于等于2的正整数;
22.所述谱图预处理方法包括:对数据不进行处理、均值中心化、均值方差化、矢量归一化、标准正态变量变换、多元散射校正、savitzky-golay卷积平滑、一阶导数法。
23.本发明通过预设的多种谱图预处理方法对所述待处理校正集和待处理验证集进行独立处理,在建模过程中可根据每种处理方法下模型的效果,选择合适的谱图处理方法,加强对非线性指标检测的准确性。
24.作为优选例子,在所述根据预设的kpls建模方法,从所述若干个校正集中筛选出最小均偏差值最小的第一数据集,具体包括:
25.根据预设的kpls建模方法,分别对所述若干个校正集进行建模,获得若干个第一模型,并计算各第一模型所对应的最小均偏差值,选取所述最小均偏差值最小的校正集为第一数据集。
26.本发明使用了kpls算法构建模型,不需要使用太多参数,减少了算法运行时间,提高效率,与此同时,通过比较所述若干个校正集输入到所述kpls模型后得到的最小均偏差值,选择最小均偏差值最小的校正集为第一数据集,也就是筛选出处理效果最好的谱图预处理方法,提高检测的准确性。
27.作为优选例子,在所述根据预设的kpls建模方法,从所述若干个校正集中筛选出最小均偏差值最小的第一数据集之前,包括:
28.通过所述若干个数据集中数据矩阵与物性指标进行相关性分析,得到不同维度数据与物性之间的相关性系数,根据相关性系数从大到小排序,定步长选取不同的数据点,根据所述不同的数据点搭建一个数据点与物性指标的简易模型,并根据所述简易模型的效果选出最佳数据点数目及具体区域;
29.根据所述最佳数据点数目及具体区域,更新各所述数据集。
30.本发明对所述若干个数据集中的数据进行降维处理,选出最佳数据点数目及数据区域,一方面可以减少无用信息的干扰,另一方面,可以减少需要处理的数据,提高建模的效率。
31.作为优选例子,在所述根据所述第一数据集和所述预设的初始模型,分别构建pls模型、ann模型、kpls模型和ga-kpls模型,具体包括:
32.根据所述第一数据集和pls初始模型,构建pls模型;
33.根据所述第一数据集和ann初始模型,构建ann模型;
34.根据所述第一数据集和kpls初始模型,构建kpls模型;
35.根据已构建的kpls模型,采用ga算法对所述kpls模型中引入的核函数的参数进行优化,获得ga-kpls模型;
36.根据已构建的kpls模型,结合预设的核函数,分别构建pf-kpls模型、rbf-kpls模型和mix-kpls模型。
37.本发明首先根据预设的初始模型和所述第一数据集构建pls模型、ann模型、kpls模型和ga-kpls模型,搭建多种模型解决了现有技术在对非线性指标建模时模型单一的问题,同时所述ga-kpls模型是采用ga算法对所述kpls模型中引入的核函数的相关参数进行优化,进而找到模型的最优操作参数,可进一步提高模型的准确性。
38.作为优选例子,在所述根据所述验证集,分别对所述pls模型、所述ann模型、所述kpls模型和所述ga-kpls模型进行预测验证,并根据验证结果,从已验证的模型中确定待建模指标的图谱预测模型,具体包括:
39.分别将所述验证集中的光谱数据图输入各已构建的第二模型,并获得各所述第二模型的在不同谱图下的预测值;其中,所述第二模型包括:pls模型、ann模型、kpls模型、ga-kpls模型、pf-kpls模型、rbf-kpls模型和mix-kpls模型;
40.比对各预测值与所述验证集中的化验分析数据,计算各所述第二模型的最小均偏差值;
41.选择最小均偏差值最小的第二模型作为待建模指标的图谱预测模型。
42.本发明通过将所述验证集中的光谱数据图输入到各已构建的第二模型,获得各所述第二模型的在不同谱图下的预测值,然后比对各预测值与所述验证集中的化验分析数据,筛选出所述最小均偏差值最小的模型作为待建模指标的图谱预测模型,能够适配非线性指标的自身特性,从而提高该待构建指标的检测准确性。
43.另一方面,本发明实施例提供了一种石油化工中样品非线性指标的模型建立装置,包括:数据采集模块、数据处理模块、筛选模块、模型生成模块和模型验证模块;
44.所述数据采集模块用于根据样品的种类选择不同分析仪获取待建模指标的多个待处理样品数据;其中,所述待处理样品数据包括若干个光谱数据图以及各所述光谱数据图对应的化验分析数据;
45.所述数据处理模块用于根据预设的若干个谱图处理方法对所述待处理样品数据进行处理,得到若干个数据集;其中,所述数据集包括校正集和验证集,且每个数据集包括若干个处理后的待处理样品数据;
46.所述筛选模块用于根据预设的kpls建模方法,从所述若干个校正集中筛选出最小均偏差值最小的第一数据集;
47.所述模型生成模块用于根据预设的初始模型以及所述第一数据集生成pls模型、ann模型、kpls模型和ga-kpls模型;其中,所述初始模型包括pls初始模型、ann初始模型、kpls初始模型;所述ga-kpls模型是由已构建的kpls模型经过ga算法优化后而获得;
48.所述模型验证模块用于根据所述验证集,分别对所述pls模型、所述ann模型、所述kpls模型和所述ga-kpls模型进行预测验证,并根据验证结果,从已验证的模型中确定待建模指标的图谱预测模型。
49.本发明首先通过数据采集模块分析待建模样品的种类选择合适的分析仪对所述待建模样品进行扫描,获取待处理数据,提高检测的准确性,接着通过数据处理模块中预设的若干个谱图处理方法对所述待处理数据进行处理得到若干个数据集,谱图处理方法更多,种类更丰富,更能找到合适的谱图处理方法,提高检测的精准度,然后在筛选模块中通过kpls方法所构建的模型找出处理效果最好的谱图处理方法,减少接下来建模需要处理的数据,提高建模效率,然后在模型生成模块中构建pls模型、ann模型、kpls模型和ga-kpls模型,所述ga-kpls模型是由已构建的kpls模型经过ga算法优化后而获得,利用ga算法对kpls模型参数进行优化,能够进一步加强模型的精准度,最后通过模型验证模块将所述验证集输入到所述pls模型、所述ann模型、所述kpls模型和所述ga-kpls模型中进行预测验证,筛选出最小均偏差值最小的模型作为待建模样品的图谱预测模型,相比于现有技术对某一非
线性指标固定使用一种模型构建方法,本发明从多个已构建模型中筛选出符合待构建指标的图谱预测模型,能够适配非线性指标的自身特性,从而提高该待构建指标的检测准确性。
50.作为优选例子,在所述数据处理模块包括:谱图处理单元和分类单元;
51.所述谱图处理单元用于根据预设的若干个谱图处理方法对获取的所述待处理样品数据处理,得到若干个数据集;
52.所述分类单元用于根据kennard-stone算法,对所述若干个数据进行分类,分为待处理校正集和待处理验证集。
53.本发明通过谱图处理单元根据预设的若干个谱图处理方法对获取的所述待处理样品数据处理,能够更加准确的选择出处理效果更好的谱图处理方法,同时分类单元采用kennard-stone算法,将所述若干个数据进行分类,分为待处理校正集和待处理验证集,方便后续模型生成和模型评价。
附图说明
54.图1:为本发明实施例一提供的一种石油化工中样品非线性指标的模型建立方法的一种流程示意图;
55.图2:为本发明实施例二提供的一种石油化工中样品非线性指标的模型建立方法的另一种流程示意图;
56.图3:为本发明实施例一提供的原油样品粘度数值分布散点图;
57.图4:为本发明实施例一提供的原油粘度不同模型方法下均偏差值对比图;
58.图5:为本发明实施例二提供的汽油样品蒸气压数值分布散点图;
59.图6:为本发明实施例二提供的汽油蒸气压不同模型方法下均偏差对比图。
具体实施方式
60.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
61.实施例一
62.请参照图1,为本发明实施例提供的一种石油化工中样品非线性指标的模型建立方法的一种流程示意图,其主要包括步骤101至步骤106,具体如下:
63.步骤101:获取待建模指标的多个待处理样品数据。
64.在本实施例中,步骤101具体为:根据待采集样品的种类,确定分析仪的类型,并通过确定类型的分析仪,对若干个待采集样品进行扫描,获得每个待采集样品各自对应的光谱数据图;其中,每个待采集样品对应一个所述待建模指标的化验分析数据,且各待采集样品的种类相同。
65.在本实施例中,建模之前,选用的多个待处理样品是具有非线性指标粘度的原油,需要获取的待处理样品数据包括所述原油样品的光谱数据图以及化验分析数据集。首先,因为本实施例中选择的样品是原油,所以采用的分析仪种类为中红外分析仪,对所述原油样品进行扫描,获得所述原油样品的光谱数据图,然后采用标准方法及传统的分析仪获得
所述原油样品对应的化验分析数据集,所述原油样品粘度数值分布情况如图3,图3为原油样品粘度数值分布散点图。
66.步骤102:通过预设的若干个谱图处理方法对所述待处理样品数据进行处理,得到若干个数据集。
67.在本实施例中,步骤102具体为:根据kennard-stone算法,对若干个待处理数据进行分类,分为待处理校正集和待处理验证集;通过n种不同的谱图预处理方法,分别对所述待处理校正集和待处理验证集进行独立处理,获得n个校正集和n个验证集,从而获得n个数据集,其中n为大于等于2的正整数;所述谱图预处理方法包括:对数据不进行处理、均值中心化、均值方差化、矢量归一化、标准正态变量变换、多元散射校正、savitzky-golay卷积平滑、一阶导数法。
68.在本实施例中,首先根据kolmogorov-smirnov算法,对若干个待处理数据进行分类也就是获得的所述原油样品的光谱数据图中的光谱数据进行分类,分为校正集和验证集,然后根据n种不同的谱图预处理方法,分别对所述校正集和验证集进行独立处理,获得n个校正集和n个验证集,也就是通过预设的若干个谱图处理方法包括不进行处理、均值中心化、均值方差化、矢量归一化、标准正态变量变换、多元散射校正、savitzky-golay卷积平滑、一阶导数法,获得处理后的校正集和验证集,所述处理后的校正集谱图用来构建模型,所述处理后的验证集谱图用来模型评价,可以方便本实施例快速的找到各个样本的编号,加快检测速度。
69.步骤103:对所述若干个数据集进行区间选取。
70.在本实施例中,步骤103具体为:通过所述若干个数据集中数据矩阵与物性指标进行相关性分析,得到不同维度数据与物性之间的相关性系数,根据相关性系数从大到小排序,定步长选取不同的数据点,根据所述不同的数据点搭建一个数据点与物性指标的简易模型,并根据所述简易模型的效果选出最佳数据点数目及具体区域;根据所述最佳数据点数目及具体区域,更新各所述数据集。
71.在本实施例中,对经过谱图处理的所述校正集和验证集中的数据进行区间选取,分析所述校正集和所述验证集中数据与非线性指标粘度间的相关性后,,选择的数据点数目从20开始,按照步长为5进行调整至2525,然后根据每一次的选择搭建pls模型,然后根据搭建出的pls模型的效果对所述校正集和验证集进行更新,减少后期进行模型构建需要处理的数据。
72.步骤104:根据预设的kpls建模方法,从所述若干个校正集中筛选出最小均偏差值最小的第一数据集。
73.在本实施例中,步骤104具体为:根据预设的kpls建模方法,分别对所述若干个校正集进行建模,获得若干个第一模型,并计算各第一模型所对应的最小均偏差值,选取所述最小均偏差值最小的校正集为第一数据集。
74.本实施例中,根据经过kolmogorov-smirnov算法进行分类之后获得的校正集,利用kpls算法构建模型,获得所述若干个第一模型,然后求出不同谱图处理方法下获得的验证集输入到模型后获得的最小均偏差值,选取所述最小均偏差值最小的数据集作为下一步建模的数据集。
75.在本实施例中,不同谱图处理方法获得的最小均偏差表如下:
[0076][0077][0078]
在本实施例中,由表中数据可以看出,当选择第2种预处理方案(savitzky-golay卷积平滑)对谱图进行处理时,最小均偏差值最小,说明所述原油样品经过中红外分析仪进行扫描后获得的光谱经savitzky-golay卷积平滑方法处理后,能够降低噪音等因素对后续利用各种kpls方法建模过程的影响,提高模型精度。因而选取经过savitzky-golay卷积平滑方法处理的数据集为第一数据集,作为下一步建模所用数据集。
[0079]
步骤105:根据所述第一数据集和所述预设的初始模型,分别构建pls模型、ann模型、kpls模型和ga-kpls模型。
[0080]
在本实施例中,步骤105具体为:通过预设的pls初始模型、ann初始模型、kpls初始模型,结合所述第一数据集构建pls模型、ann模型、kpls模型,同时根据已构建的kpls模型,采用ga算法对所述kpls模型中引入的核函数的参数进行优化,获得ga-kpls模型。
[0081]
作为本实施例的一种举例,在构建上述模型后,还可以根据已构建的kpls模型,结合预设的核函数,分别构建pf-kpls模型、rbf-kpls模型和mix-kpls模型。本举例通过不同的核函数,构建更多类型的kpls模型,解决了在进行非线性指标建模时引用kpls模型单一的问题。
[0082]
步骤106:根据所述验证集,分别对所述pls模型、所述ann模型、所述kpls模型和所述ga-kpls模型进行预测验证,并根据验证结果,从已验证的模型中确定待建模指标的图谱预测模型。
[0083]
在本实施例中,步骤106具体为:分别将所述验证集中的光谱数据图输入各已构建的第二模型,并获得各所述第二模型的在不同谱图下的预测值;其中,所述第二模型包括:pls模型、ann模型、kpls模型、ga-kpls模型、pf-kpls模型、rbf-kpls模型和mix-kpls模型;比对各预测值与所述验证集中的化验分析数据,计算各所述第二模型的最小均偏差值;选择最小均偏差值最小的第二模型作为待建模指标的图谱预测模型。
[0084]
在本实施例中,构建完所述的第二模型,就是pls模型、ann模型、kpls模型、ga-kpls模型、pf-kpls模型、rbf-kpls模型和mix-kpls模型后,将所述经过相同处理的验证集谱图输入到构建的所述各种模型,分别求取谱图输入到模型后得到的预测值,并与所述化验分析数据集中的数据进行对比,求出每种模型的最小均偏差。每种模型的最小均偏差如下表,以及图4为原油粘度不同模型方法下均偏差对比图。
[0085]
方案序号模型方法最小均偏差(mm2/s)方案1pls55.721方案2ann47.251方案3pf-kpls33.165方案4rbf-kpls23.574方案5mix-kpls22.962方案6ga-kpls20.356
[0086]
在本实施例中,由上表和图4可知将所述验证集输入到构建的ga-kpls模型中时,获得的最小均偏差值最小,因此可知ga-kpls模型效果最佳,因此选取所述ga-kpls模型作为本实例选取的原油样品非线性指标粘度的图谱预测模型。
[0087]
在本实施例中,本发明利用中红外分析仪对选取的原油样品进行扫描,然后采用不同的谱图预处理方法,根据获得的最小均偏差选择最适合原油样品非线性指标粘度的处理方法,最终选择的是savitzky-golay卷积平滑方法,能够提高检测的准确性,此外构建多种模型,最终筛选出最小均偏差值最小的模型解决了现有技术中对样品非线性指标建模中模型单一的技术问题,此外利用ga-kpls算法构建模型,不仅能减少需要处理的数据,加快了检测速度,又提高了检测的准确性,解决了现有石化物料中非线性指标模型存在准确性不高的技术问题。
[0088]
请参照图2,为本发明实施例二提供的一种石油化工中样品非线性指标的模型建立方法的另一种流程示意图,其主要包括步骤201至步骤206,具体如下:
[0089]
步骤201:根据近红外分析仪对收集的样品进行扫描,获得所述样品的光谱数据图,收集所述原有样品的化验分析数据集。
[0090]
在本实施例中,步骤201具体为:根据待采集样品的种类,确定分析仪的类型,并通过确定类型的分析仪,对若干个待采集样品进行扫描,获得每个待采集样品各自对应的光谱数据图;其中,每个待采集样品对应一个所述待建模指标的化验分析数据,且各待采集样品的种类相同。
[0091]
在本实施例中,建模之前,选用的多个待处理样品是具有非线性指标蒸汽压的汽油,需要获取的待处理样品数据包括所述汽油样品的光谱数据图以及化验分析数据集。首先,因为本实施例中选择的样品是汽油,所以采用近红外分析仪对所述汽油样品进行扫描,获得所述汽油样品的光谱数据图,然后采用标准方法及传统的分析仪获得所述原油样品对应的化验分析数据集,所述汽油样品蒸汽压数值分布情况如图5,图5为汽油样品蒸气压数值分布散点图。
[0092]
步骤202:通过预设的若干个谱图处理方法对所述待处理样品数据进行处理,得到若干个数据集。
[0093]
在本实施例中,步骤202具体为:根据kennard-stone算法,对若干个待处理数据进
行分类,分为待处理校正集和待处理验证集;通过n种不同的谱图预处理方法,分别对所述待处理校正集和待处理验证集进行独立处理,获得n个校正集和n个验证集,从而获得n个数据集,其中n为大于等于2的正整数;所述谱图预处理方法包括:对数据不进行处理、均值中心化、均值方差化、矢量归一化、标准正态变量变换、多元散射校正、savitzky-golay卷积平滑、一阶导数法。
[0094]
在本实施例中,首先根据kolmogorov-smirnov算法,对若干个待处理数据进行分类也就是获得的所述汽油样品的光谱数据图中的光谱数据进行分类,分为校正集和验证集,然后根据n种不同的谱图预处理方法,分别对所述校正集和验证集进行独立处理,获得n个校正集和n个验证集,也就是通过预设的若干个谱图处理方法包括不进行处理、均值中心化、均值方差化、矢量归一化、标准正态变量变换、多元散射校正、savitzky-golay卷积平滑、一阶导数法,获得处理后的校正集和验证集,所述处理后的校正集谱图用来构建模型,所述处理后的验证集谱图用来模型评价,可以方便本实施例快速的找到各个样本的编号,加快检测速度。
[0095]
步骤203:对所述若干个数据集进行区间选取。
[0096]
在本实施例中,步骤203具体为:通过所述若干个数据集中数据矩阵与物性指标进行相关性分析,得到不同维度数据与物性之间的相关性系数,根据相关性系数从大到小排序,定步长选取不同的数据点,根据所述不同的数据点搭建一个数据点与物性指标的简易模型,并根据所述简易模型的效果选出最佳数据点数目及具体区域;根据所述最佳数据点数目及具体区域,更新各所述数据集。
[0097]
在本实施例中,对经过谱图处理的所述校正集和验证集中的数据进行区间选取,分析所述校正集和所述验证集中数据与非线性指标粘度间的相关性后,,选择的数据点数目从20开始,按照步长为5进行调整至2525,然后根据每一次的选择搭建pls模型,然后根据搭建出的pls模型的效果对所述校正集和验证集进行更新,减少后期进行模型构建需要处理的数据。
[0098]
步骤204:根据预设的kpls建模方法,从所述若干个校正集中筛选出最小均偏差值最小的第一数据集。
[0099]
在本实施例中,步骤204具体为:根据预设的kpls建模方法,分别对所述若干个校正集进行建模,获得若干个第一模型,并计算各第一模型所对应的最小均偏差值,选取所述最小均偏差值最小的校正集为第一数据集。
[0100]
本实施例中,根据经过kolmogorov-smirnov算法进行分类之后获得的校正集,利用kpls算法构建模型,获得所述若干个第一模型,然后求出不同谱图处理方法下获得的验证集输入到模型后获得的最小均偏差值,选取所述最小均偏差值最小的数据集作为下一步建模的数据集。
[0101]
在本实施例中,不同谱图处理方法获得的最小均偏差表如下:
kpls模型、pf-kpls模型、rbf-kpls模型和mix-kpls模型后,将所述经过相同处理的验证集谱图输入到构建的所述各种模型,分别求取谱图输入到模型后得到的预测值,并与所述化验分析数据集中的数据进行对比,求出每种模型的最小均偏差。每种模型的最小均偏差如下表,以及图6为汽油蒸汽压不同模型方法下均偏差对比图。
[0110][0111][0112]
在本实施例中,由上表和图4可知将所述验证集输入到构建的ga-kpls模型中时,获得的最小均偏差值最小,因此可知ga-kpls模型效果最佳,因此选取所述ga-kpls模型作为本实例选取的汽油样品非线性指标蒸汽压的图谱预测模型。
[0113]
在本实施例中,本发明利用近红外分析仪对选取的汽油样品进行扫描,然后采用不同的谱图预处理方法,根据获得的最小均偏差选择最适合汽油样品非线性指标蒸汽压的处理方法,最终选择的是多元散射校正方法,能够提高检测的准确性,此外构建多种模型,最终筛选出最小均偏差值最小的模型解决了现有技术中对样品非线性指标建模中模型单一的技术问题,此外利用ga-kpls算法构建模型,不仅能减少需要处理的数据,加快了检测速度,又提高了检测的准确性,解决了现有石化物料中非线性指标模型存在准确性不高的技术问题。
[0114]
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:1.一种石油化工中样品非线性指标的模型建立方法,其特征在于,包括:获取待建模指标的多个待处理样品数据;其中,所述待处理样品数据包括若干个光谱数据图以及各所述光谱数据图对应的化验分析数据;通过预设的若干个谱图处理方法对所述待处理样品数据进行处理,得到若干个数据集;其中,所述数据集包括校正集和验证集,且每个数据集包括若干个处理后的待处理样品数据;根据预设的kpls建模方法,从所述若干个校正集中筛选出最小均偏差值最小的第一数据集;根据所述第一数据集和所述预设的初始模型,分别构建pls模型、ann模型、kpls模型和ga-kpls模型;其中,所述初始模型包括pls初始模型、ann初始模型、kpls初始模型;所述ga-kpls模型是由已构建的kpls模型经过ga算法优化后而获得;根据所述验证集,分别对所述pls模型、所述ann模型、所述kpls模型和所述ga-kpls模型进行预测验证,并根据验证结果,从已验证的模型中确定待建模指标的图谱预测模型。2.如权利要求1所述的一种石油化工中样品非线性指标的模型建立方法,其特征在于,所述获取待建模指标的多个待处理样品数据,具体包括:根据待采集样品的种类,确定分析仪的类型,并通过确定类型的分析仪,对若干个待采集样品进行扫描,获得每个待采集样品各自对应的光谱数据图;其中,每个待采集样品对应一个所述待建模指标的化验分析数据,且各待采集样品的种类相同。3.如权利要求1所述的一种石油化工中样品非线性指标的模型建立方法,其特征在于,所述通过预设的若干个谱图处理方法对所述待处理数据进行处理得到若干个数据集,具体包括:根据kennard-stone算法,对若干个待处理数据进行分类,分为待处理校正集和待处理验证集。4.如权利要求3所述的一种石油化工中样品非线性指标的模型建立方法,其特征在于,所述通过预设的若干个谱图处理方法对所述待处理数据进行处理,得到若干个数据集,具体包括:通过n种不同的谱图预处理方法,分别对所述待处理校正集和待处理验证集进行独立处理,获得n个校正集和n个验证集,从而获得n个数据集,其中n为大于等于2的正整数;所述谱图预处理方法包括:对数据不进行处理、均值中心化、均值方差化、矢量归一化、标准正态变量变换、多元散射校正、savitzky-golay卷积平滑、一阶导数法。5.如权利要求1所述的一种石油化工中样品非线性指标的模型建立方法,其特征在于,所述根据预设的kpls建模方法,从所述若干个校正集中筛选出最小均偏差值最小的第一数据集,具体包括:根据预设的kpls建模方法,分别对所述若干个校正集进行建模,获得若干个第一模型,并计算各第一模型所对应的最小均偏差值,选取所述最小均偏差值最小的校正集为第一数据集。6.如权利要求5所述的一种石油化工中样品非线性指标的模型建立方法,其特征在于,在所述根据预设的kpls建模方法,从所述若干个校正集中筛选出最小均偏差值最小的第一
数据集之前,包括:通过所述若干个数据集中数据矩阵与物性指标进行相关性分析,得到不同维度数据与物性之间的相关性系数,根据相关性系数从大到小排序,定步长选取不同的数据点,根据所述不同的数据点搭建一个数据点与物性指标的简易模型,并根据所述简易模型的效果选出最佳数据点数目及具体区域;根据所述最佳数据点数目及具体区域,更新各所述数据集。7.如权利要求1所述的一种石油化工中样品非线性指标的模型建立方法,其特征在于,所述根据所述第一数据集和所述预设的初始模型,分别构建pls模型、ann模型、kpls模型和ga-kpls模型,具体包括:根据所述第一数据集和pls初始模型,构建pls模型;根据所述第一数据集和ann初始模型,构建ann模型;根据所述第一数据集和kpls初始模型,构建kpls模型;根据已构建的kpls模型,采用ga算法对所述kpls模型中引入的核函数的参数进行优化,获得ga-kpls模型;根据已构建的kpls模型,结合预设的核函数,分别构建pf-kpls模型、rbf-kpls模型和mix-kpls模型。8.如权利要求7所述的一种石油化工中样品非线性指标的模型建立方法,其特征在于,所述根据所述验证集,分别对所述pls模型、所述ann模型、所述kpls模型和所述ga-kpls模型进行预测验证,并根据验证结果,从已验证的模型中确定待建模指标的图谱预测模型,具体包括:分别将所述验证集中的光谱数据图输入各已构建的第二模型,并获得各所述第二模型的在不同谱图下的预测值;其中,所述第二模型包括:pls模型、ann模型、kpls模型、ga-kpls模型、pf-kpls模型、rbf-kpls模型和mix-kpls模型;比对各预测值与所述验证集中的化验分析数据,计算各所述第二模型的最小均偏差值;选择最小均偏差值最小的第二模型作为待建模指标的图谱预测模型。9.一种石油化工中样品非线性指标的模型建立装置,其特征在于,包括:数据采集模块、数据处理模块、筛选模块、模型生成模块和模型验证模块;所述数据采集模块用于根据样品的种类选择不同分析仪获取待建模指标的多个待处理样品数据;其中,所述待处理样品数据包括若干个光谱数据图以及各所述光谱数据图对应的化验分析数据;所述数据处理模块用于根据预设的若干个谱图处理方法对所述待处理样品数据进行处理,得到若干个数据集;其中,所述数据集包括校正集和验证集,且每个数据集包括若干个处理后的待处理样品数据;所述筛选模块用于根据预设的kpls建模方法,从所述若干个校正集中筛选出最小均偏差值最小的第一数据集;所述模型生成模块用于根据预设的初始模型以及所述第一数据集生成pls模型、ann模型、kpls模型和ga-kpls模型;其中,所述初始模型包括pls初始模型、ann初始模型、kpls初始模型;所述ga-kpls模型是由已构建的kpls模型经过ga算法优化后而获得;
所述模型验证模块用于根据所述验证集,分别对所述pls模型、所述ann模型、所述kpls模型和所述ga-kpls模型进行预测验证,并根据验证结果,从已验证的模型中确定待建模指标的图谱预测模型。10.如权利要求9所述的一种石油化工中样品非线性指标的模型建立装置,其特征在于,所述数据处理模块包括:谱图处理单元和分类单元;所述谱图处理单元用于根据预设的若干个谱图处理方法对获取的所述待处理样品数据处理,得到若干个数据集;所述分类单元用于根据kennard-stone算法,对所述若干个数据进行分类,分为待处理校正集和待处理验证集。
技术总结本发明公开了一种石油化工中样品非线性指标的模型建立方法及装置,该方法包括获取待建模指标的多个待处理样品数据,对所述待处理样品数据进行分类、谱图处理和数据处理,然后用KPLS建模方法,筛选出构建PLS模型、ANN模型、KPLS模型以及GA-KPLS模型的数据集,所述GA-KPLS模型是由GA算法优化KPLS模型而来,然后对所述各种模型进行筛选,选择最合适的针对样品非线性指标的的模型作为图谱预测模型,提高检测的准确性。测的准确性。测的准确性。
技术研发人员:刘阳 詹辉 何恺源 邓晓旭 颜廷江
受保护的技术使用者:广东辛孚科技有限公司
技术研发日:2022.07.14
技术公布日:2022/11/1