矿井涌水水源判别的PCA-SVC方法与流程

专利2023-02-08  116


矿井涌水水源判别的pca-svc方法
技术领域
1.本发明属于矿井涌/突水水源判别预测技术领域,涉及矿井涌水水源判别的pca-svc方法。


背景技术:

2.地下水水化学成分的形成、演化是一个十分复杂的过程,它与岩性、构造条件、气候条件、水动力条件等因素密切相关,综合反映了地下水在溶滤过程中的物化结果及其平衡条件,反映了径流过程中水岩之间的溶解、溶滤、吸附、交换及其水化学平衡结果。矿井生产过程中由于自身复杂的水文地质条件和采掘的强扰动,导致煤炭资源在开采过程中面临较严重的水害问题,给矿井的安全生产造成了威胁,如何快速有效地对矿井涌(突)水水源进行判别是防治矿井水害的关键技术手段。
3.目前,矿井涌(突)水水源判别方法主要有水化学特征分析法、多元统计学方法(聚类分析、判别分析)和非线性分析方法(模糊数学、灰色系统理论、gis、svm、人工神经网络、可拓实别法等)多种方法,形成了较为成熟的水源判别理论体系。但水化学特征分析法在针对水化学特征相近水样和混合水样时不能进行有效判别,多元统计学方法和非线性分析方法在进行涌(突)水水源判别时需要满足相应的初始条件,且往往是单一进行使用,具有一定的局限性,因此有必要运用恰当的数学方法对水样的水化学数据进行分析处理,从而做出有效判别。


技术实现要素:

4.本发明的目的是提供矿井涌水水源判别的pca-svc方法,将主成分分析法(pca)和支持向量聚类svc方法相结合,pca法能够有效降低高维数据组之间的相关性,消除样本原始数据间的冗余信息,支持向量聚类svc是一种经典二分类方法,具有良好的分类效果,结合核函数可以矿井涌(突)水水源从难以判别的输入空间映射到高维水化学特征空间,然后在新空间中寻找能够最大程度正确对水源进行判别的超平面,解决了水化学特征相近水样和混合水样无法快速有效进行水源判别问题。
5.本发明所采用的技术方案是,矿井涌水水源判别的pca-svc方法,具体包括以下步骤:
6.步骤1,收集研究区以往普详勘阶段水文地球化学数据,统计得到水化学数据统计成果表;
7.步骤2,将经步骤1得到的成果表进行分析,对水化学数据缺乏的含水层进行针对性取样,完善对照组水化学数据;
8.步骤3,选取步骤2得到的水化学数据中阳离子和阴离子进行piper三线图绘制,进行矿井涌水水源初判别;
9.步骤4,利用pca法对水化学成分存在交叉的原始高维数据进行降维处理;
10.步骤5,获取主成分表达式,对各主要充水含水层水进行赋值,即来自同一含水层
的水样赋值相同;
11.步骤6,利用支持向量聚类svc模型进行训练,计算预测准确率确定模型可靠性;
12.步骤7,根据svc聚类模型分选计算待判别水样的类别。
13.本发明的特点还在于:
14.其中步骤3中,水化学分析法需要选取6大离子,即阳离子为ca
2+
、mg
2+
、k
+
+na
+
,阴离子为hco
3-、cl-、so
42-,在aquachem软件中绘制piper三线图,通过piper三线图可对大量水样进行两两比较,实现对涌/突水水样的初判别;
15.其中步骤4中,对原始高维数据进行降维处理,高维数据为ca
2+
、mg
2+
、k
+
+na
+
、hco
3-、cl-、so
42-、ph和矿化度共8个指标;
16.其中步骤4中利用pca法对水化学成分存在交叉的原始高位数据进行降维处理具体的计算方法如下:
17.首先设待处理数据x有n个样本,每个样本有p个指标,即p个变量,得到数据结构x,然后对x进行降维处理得到新变量f1,f2,
···
,fm(m<<p),m取值即主成分个数是依据f1,f2,
···
,fm的方差累计贡献率达到85%以上;
[0018][0019][0020]
其中,x为样本原始数据集合,f1,f2,
···
,fm为第1、第2和第m主成分,z
p
为第p个指标的变量,l
mp
为相关矩阵的p个较大特征值对应的特征向量;
[0021]
其中步骤5中所述主成分表达式为选取方差累计贡献率大于85%的主成分即可;
[0022]
其中步骤5中,对各主要充水含水层水样进行赋值,即将来自同一含水层的水样赋值相同,设主要充水含水层有3类水样,则分别赋值为1、2和3(如有4类则分别赋值为1、2、3和4);
[0023]
其中步骤6中支持向量聚类svc模型进行训练具体如下:
[0024]
首先设定水化学数据空间(xi,yi)∈rd,数据集t={(x1,y1),(x2,y2),

,(xn,yn)}(i=1,2,

,n),其中xi表示输入水化学指标;yi表示水样的实际类别标签,包含d维空间;运用非线性变换将数据从(xi,yi)映射到高维水化学特征空间,然后在新空间中寻找可将涌水水样最大程度正确分类的超平面:
[0025][0026]
式中,r为特征空间中超球的半径,n为数据集中包含的数据个数;c为惩罚因子其
值越大允许落于超球外的点越少,ζ为松弛量,a为特征空间中超球的中心,‖
·
‖为欧基里德函数;
[0027]
其次引入拉格朗日乘式,将式(3)转化为沃尔夫wolfe对偶问题:
[0028][0029]
式中,k(xi,xj)为gaussian核函数,β为lagrangian乘子;
[0030]
再次引入gaussian核函数,并结合卡罗需
·
库恩
·
塔克kkt,向量x映射到高维空间的点距球心的距离为:
[0031][0032]
综上,得到了各点到超球球心的距离,将其映射到样本空间从而完成聚类,任意给定两个样本点,若它们分属于不同的簇,则在特征空间这两个点之间的连线上至少存在一点落于超球外。
[0033]
本发明的有益效果是
[0034]
本发明的矿井涌水水源判别的pca-svc方法针对矿井生产过程中由于自身复杂的水文地质条件和采掘的强扰动,加之可采煤层与充水含水层之间无有效隔水层,而导致的煤炭资源在开采过程中面临较严重的顶(底)板水害问题,提供了一种快速有效地矿井涌(突)水水源判别技术手段,使涌(突)水水源判别结果更加快速准确,为矿井防治水工作提供了决策和依据。
附图说明
[0035]
图1是本发明的矿井涌水水源判别的pca-svc方法的流程图。
[0036]
图2是本发明的矿井涌水水源判别的pca-svc方法中门克庆煤矿全部水样水质对比piper三线图;
[0037]
图3是本发明的矿井涌水水源判别的pca-svc方法中实际类型与预测类型准确率对比图;
[0038]
图4是本发明的矿井涌水水源判别的pca-svc方法中待判别水样预测类型图。
具体实施方式
[0039]
下面结合附图和具体实施方式对本发明进行详细说明。
[0040]
为了使本发明对判别指标选取、piper三线图绘制、pca法和支持向量聚类svc耦合、充水含水层赋值和涌(突)水水源判别具体实现,进一步详细对其说明,以下结合实例进行描述;应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
[0041]
如图1所示,本发明提供了矿井涌水水源判别的pca-svc方法,具体按以下步骤实施:
[0042]
步骤1,收集研究区(矿井)以往普详勘阶段抽(放)水试验进行过水文地球化学测试的水样数据,将水样的水化学原始数据进行统计得到水化学数据统计成果表,当各主要
充水含水层水样数据缺乏时,可进行针对性的取样并做水化学分析试验,完善主要充水含水层(对照组)水化学数据;普详勘阶段水文地球化学数据主要包含采样地点、水样名称、采样日期、k
+
、na
+
、ca
2+
、mg
2+
、cl-、hco
3-、so
42-、总硬度、ph和矿化度(溶解总固体)等;
[0043]
门克庆煤矿在普详勘阶段进行了大量的水文地质工作,获取了较多的水文地球化学数据,本次收集了41个水样的水化学成分原始数据,统计得到了水化学数据成果表,如表1所示;
[0044]
表1门克庆煤矿主要水化学数据成果表
[0045]
[0046][0047]
步骤2,将未知水源的矿井涌(突)水取样进行水化学分析,获取其水化学数据,并统计至水化学数据成果表;
[0048]
步骤3,利用各水样数据中的阳离子:ca
2+
、mg
2+
、k
+
+na
+
,阴离子:hco
3-、cl-、so
42-,在aquachem软件中绘制piper三线图,其中37号水样为待判水样1、38号水样为待判水样2、39号水样为待判水样3、40号水样为待判水样4和41号水样为待判水样5,如图2所示;
[0049]
步骤4,根据全部水样水质对比piper三线图可知,本次待判水样1、待判水样2、待判水样3、待判水样4和待判水样5均在图2中菱形区域的中部偏右的位置,说明了侏罗系直罗组孔隙裂隙承压含水层水(ⅰ类水样)、侏罗系延安组孔隙裂隙承压含水层水(ⅱ类水样)和采空区水(ⅲ类水样)水化学特征均接近,即水化学成分存在交叉无法准确进行涌水水源判别;
[0050]
利用公式1和公式2将表1中存在水化学成分交叉的29个水样进行pca预处理(水样13~41),计算得到各个指标的相关系数矩阵如下表所示;
[0051]
表2各水化学成分指标pearson相关系数矩阵
[0052]
指标ca
2+
mg
2+k+
+na
+
hco
3-cl-so
42-ph矿化度ca
2+
1.0000.8810.7370.8470.5490.849-0.5880.847mg
2+
0.8811.0000.6260.7180.4980.745-0.6330.738k
+
+na
+
0.7370.6261.0000.5130.8970.980-0.3420.983hco
3-0.8470.7180.5131.0000.2530.624-0.6160.629cl-0.5490.4980.8970.2531.0000.849-0.2170.857so
42-0.8490.7450.9800.6240.8491.000-0.4560.999ph-0.588-0.633-0.342-0.616-0.217-0.4561.000-0.441矿化度0.8470.7380.9830.6290.8570.999-0.4411.000
[0053]
发现各指标之间存在一定的相关性,例如ca
2+
和mg
2+
相关系数为0.881,so
42-和矿化度相关系数为0.999,hco
3-和ca
2+
相关系数为0.847,可见各指标之间存在较大的信息冗余,如果知己通过原始数据进行水源判别可能对模型的精度产生影响,甚至导致判别结果错误,因此有必要对原始样本数据进行pca预处理;
[0054]
在统计软件中进行涌水水源样本各指标的pca分析,得到了各主成分解释方差率如下表3所示,主成分f1和f2的特征根大于1,f1~f2方差贡献率分别为72.914%和16.510%,累计贡献率为89.424%大于85.00%;因此,主成分f1和f2包含了原始数据的绝大多数信息,能够对原样本数据进行有效的降维处理;
[0055]
表3各主成分解释方差率
[0056]
主成分特征根方差贡献率/%累计贡献率/%f15.83372.91472.914f21.32116.51089.424f30.4455.56294.986f40.2603.25498.241f50.0821.03199.272f60.0570.71899.990f70.0010.00999.999f80.0000.001100.000
[0057]
步骤5,确定了主成分个数的基础上结合成分得分系数矩阵,得到了各主成分与原始变量的数学表达式:
[0058][0059]
步骤6,利用式(3)、式(4)和式(5)同时选取13~21、24~28和31~34样本为训练样本,选取22~23、29~30和35~36样本为预测样本,利用支持向量聚类svc模型进行预测准确率确定,经计算发现预测准确率为100%(图3、表4)。
[0060]
表4门克庆煤矿水源判别及验证结果
[0061][0062][0063]
步骤7,利用构建好的涌水水源判别模型,即pca-svc判别模型,对门克庆煤矿采集的5组待判水样进行判别,判别结果如下表5所示;
[0064]
表5门克庆煤矿待判水样判别结果
[0065][0066]
判别得到泄水巷8号钻场1#孔(37号水样)和泄水巷h8-1(38号水样)为ⅰ类,即为侏罗系直罗组孔隙裂隙承压水;30202工作面运输巷6#联络巷锚索(39号水样)和30202工作面辅运8联络巷(40号水样)为ⅱ类,即为侏罗系延安组孔隙裂隙承压水;3101泄水巷新8联巷采空区(41号水样)为ⅲ类,即为采空区水;
[0067]
根据门克庆煤矿顶板疏放水设计和施工情况可知,疏放水钻孔的终孔层位进入了侏罗系直罗组;同时结合3-1
煤回采工作面导水裂隙带发育高度实测结果,导水裂隙带进入了直罗组孔隙裂隙承压含水层,表明探放水孔疏放水来自侏罗系直罗组孔隙裂隙含水层;30202工作面运输巷6#联络巷锚索仅进入了煤系地层,因此锚索孔出水来自延安组孔隙裂隙含水层;这些也都从侧面印证了待判水样利用pca-svc模型进行判别的准确性和可靠性。
[0068]
上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做的变化、改型、添加或替换,也应属于本发明的保护范围。

技术特征:
1.矿井涌水水源判别的pca-svc方法,其特征在于,具体包括以下步骤:步骤1,收集研究区以往普详勘阶段水文地球化学数据,统计得到水化学数据统计成果表;步骤2,将经步骤1得到的成果表进行分析,对水化学数据缺乏的含水层进行针对性取样,完善对照组水化学数据;步骤3,选取步骤2得到的水化学数据中阳离子和阴离子进行piper三线图绘制,进行矿井涌水水源初判别;步骤4,利用pca法对水化学成分存在交叉的原始高维数据进行降维处理;步骤5,获取主成分表达式,对各主要充水含水层水进行赋值,即来自同一含水层的水样赋值相同;步骤6,利用支持向量聚类svc模型进行训练,计算预测准确率确定模型可靠性;步骤7,根据svc聚类模型分选计算待判别水样的类别。2.根据权利要求1所述的矿井涌水水源判别的pca-svc方法,其特征在于,所述步骤3中,水化学分析法需要选取6大离子,即阳离子为ca
2+
、mg
2+
、k
+
+na
+
,阴离子为hco
3-、cl-、so
42-,绘制piper三线图,通过piper三线图可对大量水样进行两两比较,实现对涌/突水水样的初判别。3.根据权利要求1所述的矿井涌水水源判别的pca-svc方法,其特征在于,所述步骤4中,对原始高维数据进行降维处理,高维数据为ca
2+
、mg
2+
、k
+
+na
+
、hco
3-、cl-、so
42-、ph和矿化度共8个指标。4.根据权利要求1所述的矿井涌水水源判别的pca-svc方法,其特征在于,所述步骤4中利用pca法对水化学成分存在交叉的原始高位数据进行降维处理具体的计算方法如下:首先设待处理数据x有n个样本,每个样本有p个指标,即p个变量,得到数据结构x,然后对x进行降维处理得到新变量f1,f2,
···
,f
m
(m<<p),m取值即主成分个数是依据f1,f2,
···
,f
m
的方差累计贡献率达到85%以上;到85%以上;其中,x为样本原始数据集合,f1,f2,
···
,f
m
为第1、第2和第m主成分,z
p
为第p个指标的变量,l
mp
为相关矩阵的p个较大特征值对应的特征向量。5.根据权利要求1所述的矿井涌水水源判别的pca-svc方法,其特征在于,所述步骤5中所述主成分表达式为选取方差累计贡献率大于85%的主成分即可。6.根据权利要求1所述的矿井涌水水源判别的pca-svc方法,其特征在于,所述步骤5中,对各主要充水含水层水样进行赋值,即将来自同一含水层的水样赋值相同。
7.根据权利要求1所述的矿井涌水水源判别的pca-svc方法,其特征在于,所述步骤6中支持向量聚类svc模型进行训练具体如下:首先设定水化学数据空间(x
i
,y
i
)∈r
d
,数据集t={(x1,y1),(x2,y2),

,(x
n
,y
n
)}(i=1,2,

,n),其中x
i
表示输入水化学指标;y
i
表示水样的实际类别标签,包含d维空间;运用非线性变换将数据从(x
i
,y
i
)映射到高维水化学特征空间,然后在新空间中寻找可将涌水水样最大程度正确分类的超平面:式中,r为特征空间中超球的半径,n为数据集中包含的数据个数;c为惩罚因子其值越大允许落于超球外的点越少,ζ为松弛量,a为特征空间中超球的中心,‖
·
‖为欧基里德函数;其次引入拉格朗日乘式,将式(3)转化为沃尔夫wolfe对偶问题:式中,k(x
i
,x
j
)为gaussian核函数,β为lagrangian乘子;再次引入gaussian核函数,并结合卡罗需
·
库恩
·
塔克kkt,向量x映射到高维空间的点距球心的距离为:综上,得到了各点到超球球心的距离,将其映射到样本空间从而完成聚类,任意给定两个样本点,若它们分属于不同的簇,则在特征空间这两个点之间的连线上至少存在一点落于超球外。

技术总结
本发明公开了一种矿井涌/突水水源判别的PCA-SVC方法,将主成分分析法PCA和支持向量聚类SVC方法相结合,PCA法能够有效降低高维数据组之间的相关性,消除样本原始数据间的冗余信息,支持向量聚类SVC是一种经典二分类方法,具有良好的分类效果,结合核函数可以矿井涌/突水水源从难以判别的输入空间映射到高维水化学特征空间,然后在新空间中寻找能够最大程度正确对水源进行判别的超平面,提供了一种快速有效地矿井涌/突水水源判别技术手段,使涌/突水水源判别结果更加快速准确。水水源判别结果更加快速准确。水水源判别结果更加快速准确。


技术研发人员:丁湘 蒲治国 纪卓辰 冯洁 闫鑫 李哲 贺晓浪 段东伟 谢朋 刘凯祥 庞龙 张齐
受保护的技术使用者:中煤能源研究院有限责任公司
技术研发日:2022.07.22
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-843.html

最新回复(0)