一种无人机对抗策略决策方法及其系统与流程

专利2023-11-17  90



1.本技术属于非电变量的控制或调节系统领域,具体涉及一种无人机对抗策略决策方法及其系统。


背景技术:

2.大规模无人机对抗中,无人机自主进行对抗策略决策,摆脱对飞行员的依赖,能够突破飞行操作的极限,当前,无人机自主进行对抗策略决策,多是基于规则的专家系统方法、概率模型/模糊逻辑和计算智能混合方法、机器学习和深度强化学习方法,所需处理的数据量大,效率低,学习难度大,在大规模无人机对抗中效果不够理想。
3.鉴于上述技术缺陷的存在提出本技术。
4.需注意的是,以上背景技术内容的公开仅用于辅助理解本发明的发明构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本技术的申请日已经公开的情况下,上述背景技术不应当用于评价本技术的新颖性和创造性。


技术实现要素:

5.本技术的目的是提供一种无人机对抗策略决策方法及其系统,以克服或减轻已知存在的至少一方面的技术缺陷。
6.本技术的技术方案是:一方面提供一种无人机对抗策略决策方法,包括:对待决策无人机的对抗态势进行抽象,构建待决策无人机对抗态势抽象图;根据待决策无人机对抗态势抽象图,识别对待决策无人机最重要的无人机,构建待决策无人机对抗关系图;根据待决策无人机对抗关系图,进行待决策无人机的态势感知、信息交互,生成待决策无人机的对抗策略。
7.根据本技术的至少一个实施例,上述的无人机对抗策略决策方法中,所述对待决策无人机的对抗态势进行抽象,构建待决策无人机对抗态势抽象图,具体为:以待决策无人机的本体状态量、待决策无人机携带打击物的状态量、对方无人机携带能够打击待决策无人打击物的状态量,为待决策无人机的节点嵌入量;以待决策无人机与其余无人机间的相对状态量,为待决策无人机的边嵌入量;综合待决策无人机的节点嵌入量、边嵌入量,构建待决策无人机对抗态势抽象图。
8.根据本技术的至少一个实施例,上述的无人机对抗策略决策方法中,所述待决策无人机的本体状态量,包括待决策无人机的真空速、高度、爬升率、三轴姿态角、法向过载、雷达锁定信号、告警状态以及携带打击物数量;所述待决策无人机携带打击物的状态量,包括待决策无人机携带打击物的打击速度、高度、剩余打击时间、与打击目标无人机间的距离、与打击目标无人机的接近率、与打击
目标无人机之间的进入角及波束角;所述对方无人机携带能够打击待决策无人打击物的状态量,包括对方无人机携带能够打击待决策无人打击物的打击速度、高度、剩余打击时间、与待决策无人机间的距离、与待决策无人机的接近率、与待决策无人机之间的进入角及波束角;所述待决策无人机与其余无人机间的相对状态量,包括待决策无人机与其余无人机间的相对距离、接近率、高差、进入角、波束角及打击区信息。
9.根据本技术的至少一个实施例,上述的无人机对抗策略决策方法中,所述根据待决策无人机对抗态势抽象图,识别对待决策无人机最重要的无人机,构建待决策无人机对抗关系图,具体为:根据待决策无人机对抗态势抽象图,识别对待决策无人机威胁最大的对方无人机、对待决策无人机最有协同价值的己方无人机;综合对待决策无人机威胁最大的对方无人机、对待决策无人机最有协同价值的己方无人机、对对待决策无人机最有协同价值己方无人机威胁最大的对方无人机,以及以待决策无人机为最有协同价值的己方无人机,构建待决策无人机对抗关系图。
10.根据本技术的至少一个实施例,上述的无人机对抗策略决策方法中,所述根据待决策无人机对抗态势抽象图,识别对待决策无人机威胁最大的对方无人机、对待决策无人机最有协同价值的己方无人机,具体为:以第一神经网络提取待决策无人机节点嵌入量的特征;以第二神经网络提取待决策无人机边嵌入量的特征;基于待决策无人机节点嵌入量的特征、待决策无人机与各个对方无人机间边嵌入量的特征,以第一图注意力网络,得到各个对方无人机对待决策无人机的高层特征表示;基于待决策无人机节点嵌入量的特征、待决策无人机与各个己方无人机间边嵌入量的特征,以第二图注意力网络,得到各个己方无人机对待决策无人机的高层特征表示;基于各个对方无人机对待决策无人机的高层特征表示、各个己方无人机对待决策无人机的高层特征表示,以第三神经网络,通过softmax操作,得到对待决策无人机威胁最大的对方无人机、对待决策无人机最有协同价值的己方无人机。
11.根据本技术的至少一个实施例,上述的无人机对抗策略决策方法中,所述根据待决策无人机对抗关系图,进行待决策无人机的态势感知、信息交互,生成待决策无人机的对抗策略,具体为:基于待决策无人机节点嵌入量的特征、对待决策无人机最有协同价值的己方无人机节点嵌入量的特征、对待决策无人机威胁最大的对方无人机节点嵌入量的特征、对对待决策无人机最有协同价值己方无人机威胁最大的对方无人机节点嵌入量的特征、对待决策无人机最有协同价值的己方无人机与待决策无人机间边嵌入量的特征、对待决策无人机威胁最大的对方无人机与待决策无人机间边嵌入量的特征、对对待决策无人机最有协同价值己方无人机威胁最大的对方无人机与待决策无人机间边嵌入量的特征,以第三图注意力网络,得到待决策无人机的高层态势感知特征;将待决策无人机的高层态势感知特征、以待决策无人机为最有协同价值的己方无人机的高层态势感知特征进行交互,以第四神经网络,得到待决策无人机的高层态势感知融合特征;
基于待决策无人机的高层态势感知融合特征,以第五神经网络,生成待决策无人机的对抗策略。
12.根据本技术的至少一个实施例,上述的无人机对抗策略决策方法中,所述待决策无人机的对抗策略,包括待决策无人机的机动目标无人机、机动行为、打击目标无人机;其中,所述待决策无人机的机动行为,包括待决策无人机的水平机动方位、竖直机动方位、速度大小、过载量级。
13.根据本技术的至少一个实施例,上述的无人机对抗策略决策方法中,还包括:将待决策无人机的对抗策略与仿真环境进行互动,采集待决策无人机的对抗策略样本;利用待决策无人机的对抗策略样本,对无人机对抗策略决策方法中的神经网络进行训练。
14.根据本技术的至少一个实施例,上述的无人机对抗策略决策方法中,所述利用待决策无人机的对抗策略样本,对无人机对抗策略决策方法中的神经网络进行训练,具体为:利用待决策无人机的对抗策略样本,以基于近源端策略优化的强化学习算法,对无人机对抗策略决策方法中的神经网络进行训练。
15.另一方面提供一种无人机对抗策略决策系统,包括:待决策无人机对抗态势抽象图构建模块,用以对待决策无人机的对抗态势进行抽象,构建待决策无人机对抗态势抽象图;待决策无人机对抗关系图构建模块,用以根据待决策无人机对抗态势抽象图,识别对待决策无人机最重要的无人机,构建待决策无人机对抗关系图;待决策无人机的对抗策略生成模块,用以根据待决策无人机对抗关系图,进行待决策无人机的态势感知、信息交互,生成待决策无人机的对抗策略;待决策无人机的对抗策略样本采集模块,将待决策无人机的对抗策略与仿真环境进行互动,采集待决策无人机的对抗策略样本;无人机对抗策略决策神经网络训练模块,利用待决策无人机的对抗策略样本,对无人机对抗策略决策方法中的神经网络进行训练。
16.本技术至少存在以下有益技术效果:一方面提供一种无人机对抗策略决策方法,其利用图数据结构,对待决策无人机的对抗态势进行抽象,构建待决策无人机对抗态势抽象图,进而识别对待决策无人机最重要的无人机,构建待决策无人机对抗关系图,以此简化待决策无人机i的对抗关系,基于此进行待决策无人机的态势感知、信息交互,生成待决策无人机i的对抗策略,能够有效降低处理数据量,提高效率,以及能够降低待决策无人机自主对抗策略决策学习的难度,在大规模无人机对抗中取得理想效果。
17.另一方面提供一种无人机对抗策略决策系统,其与上述公开的无人机对抗策略决策方法相对应,其技术效果可参考无人机对抗策略决策方法相关部分的技术效果,在此不再赘述。
附图说明
18.图1是本技术实施例提供的无人机对抗策略决策方法的示意图;图2是本技术实施例提供的无人机对抗策略决策系统的示意图。
19.为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸,此外,附图仅用于示例性说明,不能理解为对本专利的限制。
具体实施方式
20.为使本技术的技术方案及其优点更加清楚,下面将结合附图对本技术的技术方案作进一步清楚、完整的详细描述,可以理解的是,此处所描述的具体实施例仅是本技术的部分实施例,其仅用于解释本技术,而非对本技术的限定。需要说明的是,为了便于描述,附图中仅示出了与本技术相关的部分,其余相关部分可参考通常设计,在不冲突的情况下,本技术中的实施例及实施例中的技术特征可以相互组合以得到新的实施例。
21.此外,除非另有定义,本技术描述中所使用的技术术语或者科学术语应当为本技术所属领域内一般技术人员所理解的通常含义。本技术描述中所使用的“上”、“下”、“左”、“右”、“中心”、“竖直”、“水平”、“内”、“外”等表示方位的词语仅用以表示相对的方向或者位置关系,而非暗示装置或元件必须具有特定的方位、以特定的方位构造和操作,当被描述对象的绝对位置发生改变后,其相对位置关系也可能发生相应的改变,因此不能理解为对本技术的限制。本技术描述中所使用的“第一”、“第二”、“第三”以及类似用语,仅用于描述目的,用以区分不同的组成部分,而不能够将其理解为指示或暗示相对重要性。本技术描述中所使用的“一个”、“一”或者“该”等类似词语,不应理解为对数量的绝对限制,而应理解为存在至少一个。本技术描述中所使用的“包括”或者“包含”等类似词语意指出现在该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其余元件或者物件。
22.此外,还需要说明的是,除非另有明确的规定和限定,在本技术的描述中使用的“安装”、“相连”、“连接”等类似词语应做广义理解,例如,连接可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,领域内技术人员可根据具体情况理解其在本技术中的具体含义。
23.下面结合附图1至图2对本技术做进一步详细说明。
24.一方面提供一种无人机对抗策略决策方法,包括:对待决策无人机i的对抗态势进行抽象,构建待决策无人机对抗态势抽象图gs_i;根据待决策无人机对抗态势抽象图gs_i,识别对待决策无人机i最重要的无人机,构建待决策无人机对抗关系图gt_i;根据待决策无人机对抗关系图gt_i,进行待决策无人机i的态势感知、信息交互,生成待决策无人机i的对抗策略。
25.对于上述实施例公开的无人机对抗策略决策方法,领域内技术人员可以理解的是,其利用图数据结构,对待决策无人机i的对抗态势进行抽象,构建待决策无人机对抗态势抽象图gs_i,进而识别对待决策无人机i最重要的无人机,构建待决策无人机对抗关系图gt_i,以此简化待决策无人机i的对抗关系,基于此进行待决策无人机i的态势感知、信息交
互,生成待决策无人机i的对抗策略,能够有效降低处理数据量,提高效率,以及能够降低待决策无人机自主对抗策略决策学习的难度,在大规模无人机对抗中取得理想效果。
26.在一些可选的实施例中,上述的无人机对抗策略决策方法中,所述对待决策无人机i的对抗态势进行抽象,构建待决策无人机对抗态势抽象图gs_i,具体为:以待决策无人机i的本体状态量sself_i、待决策无人机携带打击物的状态量smsls_i、对方无人机携带能够打击待决策无人打击物的状态量smslo_i,为待决策无人机i的节点嵌入量;以待决策无人机与其余无人机间的相对状态量srel_i,为待决策无人机i的边嵌入量;综合待决策无人机i的节点嵌入量、边嵌入量,构建待决策无人机对抗态势抽象图gs_i,其是以待决策无人机i为中心节点的星形图,其出度为其余无人机的数量,指向其余飞机。
27.在一些可选的实施例中,上述的无人机对抗策略决策方法中,所述待决策无人机i的本体状态量sself_i,包括待决策无人机i的真空速、高度、爬升率、三轴姿态角、法向过载、雷达锁定信号、告警状态以及携带打击物数量;所述待决策无人机携带打击物的状态量smsls_i,包括待决策无人机携带打击物的打击速度、高度、剩余打击时间、与打击目标无人机间的距离、与打击目标无人机的接近率、与打击目标无人机之间的进入角及波束角;所述对方无人机携带能够打击待决策无人打击物的状态量smslo_i,包括对方无人机携带能够打击待决策无人打击物的打击速度、高度、剩余打击时间、与待决策无人机间的距离、与待决策无人机的接近率、与待决策无人机之间的进入角及波束角;所述待决策无人机与其余无人机间的相对状态量srel_i,包括待决策无人机与其余无人机间的相对距离、接近率、高差、进入角、波束角及打击区信息。
28.在一些可选的实施例中,上述的无人机对抗策略决策方法中,所述根据待决策无人机对抗态势抽象图gs_i,识别对待决策无人机最重要的无人机,构建待决策无人机对抗关系图gt_i,具体为:根据待决策无人机对抗态势抽象图gs_i,识别对待决策无人机威胁最大的对方无人机d_i、对待决策无人机最有协同价值的己方无人机j_i;综合对待决策无人机威胁最大的对方无人机d_i、对待决策无人机最有协同价值的己方无人机j_i、对对待决策无人机最有协同价值己方无人机威胁最大的对方无人机d_j_i,以及以待决策无人机为最有协同价值的己方无人机j_j_i,构建待决策无人机对抗关系图gt_i,其是以待决策无人机为中心节点,其出度为3,分别指向对待决策无人机威胁最大的对方无人机d_i、对待决策无人机最有协同价值的己方无人机j_i、对对待决策无人机最有协同价值己方无人机威胁最大的对方无人机d_j_i,其入度等于以待决策无人机为最有协同价值的己方无人机j_j_i的数量,指向各个以待决策无人机为最有协同价值的己方无人机j_j_i。
29.在一些可选的实施例中,上述的无人机对抗策略决策方法中,所述根据待决策无人机对抗态势抽象图gs_i,识别对待决策无人机威胁最大的对方无人机d_i、对待决策无人
机最有协同价值的己方无人机j_i,具体为:以第一神经网络提取待决策无人机i节点嵌入量的特征v_i=f_1(sself_i,smsls_i,smslo_i),其中,f_1(.)为第一神经网络;以第二神经网络提取待决策无人机i边嵌入量的特征e_ij=f_2(srel_ij),其中,f_2(.)为第二神经网络;e_ij为待决策无人机与其余第j个飞机间边嵌入量的特征;srel_ij为待决策无人机与其余第j个无人机间的相对状态量;基于待决策无人机节点嵌入量的特征v_i、待决策无人机与各个对方无人机间边嵌入量的特征e_id,以第一图注意力网络gat_1(.),得到各个对方无人机对待决策无人机的高层特征表示ho_id;基于待决策无人机节点嵌入量的特征v_i、待决策无人机与各个己方无人机间边嵌入量的特征e_ij,以第二图注意力网络gat_2(.),得到各个己方无人机对待决策无人机的高层特征表示hf_ij;基于各个对方无人机对待决策无人机的高层特征表示ho_id、各个己方无人机对待决策无人机的高层特征表示hf_ij,以第三神经网络f_3(.),为一个双头神经网络,通过softmax操作,得到对待决策无人机威胁最大的对方无人机d_i、对待决策无人机最有协同价值的己方无人机j_i。
30.在一些可选的实施例中,上述的无人机对抗策略决策方法中,所述根据待决策无人机对抗关系图gt_i,进行待决策无人机i的态势感知、信息交互,生成待决策无人机i的对抗策略,具体为:基于待决策无人机节点嵌入量的特征v_i、对待决策无人机最有协同价值的己方无人机节点嵌入量的特征v_j_i、对待决策无人机威胁最大的对方无人机节点嵌入量的特征v_d_i、对对待决策无人机最有协同价值己方无人机威胁最大的对方无人机节点嵌入量的特征v_d_j_i、对待决策无人机最有协同价值的己方无人机与待决策无人机间边嵌入量的特征e_ij_i、对待决策无人机威胁最大的对方无人机与待决策无人机间边嵌入量的特征e_id_i、对对待决策无人机最有协同价值己方无人机威胁最大的对方无人机与待决策无人机间边嵌入量的特征e_id_j_i,以第三图注意力网络gat_3(.),得到待决策无人机i的高层态势感知特征h_i;将待决策无人机i的高层态势感知特征h_i、以待决策无人机为最有协同价值的己方无人机的高层态势感知特征h_j_j_i进行交互,以第四神经网络f_4(.),得到待决策无人机i的高层态势感知融合特征x_i;基于待决策无人机i的高层态势感知融合特征x_i,以第五神经网络f_5(.),生成待决策无人机i的对抗策略。
31.在一些可选的实施例中,上述的无人机对抗策略决策方法中,所述待决策无人机i的对抗策略,包括待决策无人机i的机动目标无人机、机动行为、打击目标无人机,第五神经网络f_5(.)为一个三头神经网络,其中,所述待决策无人机i的机动行为,包括待决策无人机i的水平机动方位、竖直机动方位、速度大小、过载量级。
32.在一些可选的实施例中,上述的无人机对抗策略决策方法中,还包括:将待决策无人机i的对抗策略与仿真环境进行互动,采集待决策无人机i的对抗策
略样本;利用待决策无人机i的对抗策略样本,对无人机对抗策略决策方法中的神经网络进行训练。
33.在一些可选的实施例中,上述的无人机对抗策略决策方法中,所述利用待决策无人机i的对抗策略样本,对无人机对抗策略决策方法中的神经网络进行训练,具体为:利用待决策无人机i的对抗策略样本,以基于近源端策略优化的强化学习算法,对无人机对抗策略决策方法中的神经网络进行训练。
34.在一些可选的实施例中,上述的无人机对抗策略决策方法中,第一神经网络f_1(.)为、第二神经网络f_2(.)、第三神经网络f_3(.)、第四神经网络f_4(.)、第五神经网络f_5(.)为全连接神经网络。
35.另一方面提供一种无人机对抗策略决策系统,包括:待决策无人机对抗态势抽象图gs_i构建模块,用以对待决策无人机i的对抗态势进行抽象,构建待决策无人机对抗态势抽象图gs_i;待决策无人机对抗关系图gt_i构建模块,用以根据待决策无人机对抗态势抽象图gs_i,识别对待决策无人机i最重要的无人机,构建待决策无人机对抗关系图gt_i;待决策无人机i的对抗策略生成模块,用以根据待决策无人机对抗关系图gt_i,进行待决策无人机i的态势感知、信息交互,生成待决策无人机i的对抗策略;待决策无人机i的对抗策略样本采集模块,将待决策无人机i的对抗策略与仿真环境进行互动,采集待决策无人机i的对抗策略样本;无人机对抗策略决策神经网络训练模块,利用待决策无人机i的对抗策略样本,对无人机对抗策略决策方法中的神经网络进行训练。
36.对于上述实施例公开的无人机对抗策略决策系统,由于其与上述实施例公开的无人机对抗策略决策方法相对应,描述的较为简单,具体相关之处可参见无人机对抗策略决策方法部分的相关说明,其技术效果也可参考无人机对抗策略决策方法相关部分的技术效果,在此不再赘述。
37.此外,领域内技术人员还应该能够意识到,本技术实施例所公开装置的各个模块、单元能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,本技术中对其按照功能进行了一般性地描述,这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件,领域内技术人员可以对每个特定的应用及其实际约束条件选择采用不同的方法来实现所描述的功能,但是该种实现不应认为超出本技术的范围。
38.说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其余实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
39.至此,已经结合附图所示的优选实施方式描述了本技术的技术方案,领域内技术人员应该理解的是,本技术的保护范围显然不局限于这些具体实施方式,在不偏离本技术的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本技术的保护范围之内。

技术特征:
1.一种无人机对抗策略决策方法,其特征在于,包括:对待决策无人机的对抗态势进行抽象,构建待决策无人机对抗态势抽象图;根据待决策无人机对抗态势抽象图,识别对待决策无人机最重要的无人机,构建待决策无人机对抗关系图;根据待决策无人机对抗关系图,进行待决策无人机的态势感知、信息交互,生成待决策无人机的对抗策略。2.根据权利要求1所述的无人机对抗策略决策方法,其特征在于,所述对待决策无人机的对抗态势进行抽象,构建待决策无人机对抗态势抽象图,具体为:以待决策无人机的本体状态量、待决策无人机携带打击物的状态量、对方无人机携带能够打击待决策无人打击物的状态量,为待决策无人机的节点嵌入量;以待决策无人机与其余无人机间的相对状态量,为待决策无人机的边嵌入量;综合待决策无人机的节点嵌入量、边嵌入量,构建待决策无人机对抗态势抽象图。3.根据权利要求2所述的无人机对抗策略决策方法,其特征在于,所述待决策无人机的本体状态量,包括待决策无人机的真空速、高度、爬升率、三轴姿态角、法向过载、雷达锁定信号、告警状态以及携带打击物数量;所述待决策无人机携带打击物的状态量,包括待决策无人机携带打击物的打击速度、高度、剩余打击时间、与打击目标无人机间的距离、与打击目标无人机的接近率、与打击目标无人机之间的进入角及波束角;所述对方无人机携带能够打击待决策无人打击物的状态量,包括对方无人机携带能够打击待决策无人打击物的打击速度、高度、剩余打击时间、与待决策无人机间的距离、与待决策无人机的接近率、与待决策无人机之间的进入角及波束角;所述待决策无人机与其余无人机间的相对状态量,包括待决策无人机与其余无人机间的相对距离、接近率、高差、进入角、波束角及打击区信息。4.根据权利要求3所述的无人机对抗策略决策方法,其特征在于,所述根据待决策无人机对抗态势抽象图,识别对待决策无人机最重要的无人机,构建待决策无人机对抗关系图,具体为:根据待决策无人机对抗态势抽象图,识别对待决策无人机威胁最大的对方无人机、对待决策无人机最有协同价值的己方无人机;综合对待决策无人机威胁最大的对方无人机、对待决策无人机最有协同价值的己方无人机、对对待决策无人机最有协同价值己方无人机威胁最大的对方无人机,以及以待决策无人机为最有协同价值的己方无人机,构建待决策无人机对抗关系图。5.根据权利要求4所述的无人机对抗策略决策方法,其特征在于,所述根据待决策无人机对抗态势抽象图,识别对待决策无人机威胁最大的对方无人机、对待决策无人机最有协同价值的己方无人机,具体为:以第一神经网络提取待决策无人机节点嵌入量的特征;以第二神经网络提取待决策无人机边嵌入量的特征;基于待决策无人机节点嵌入量的特征、待决策无人机与各个对方无人机间边嵌入量的特征,以第一图注意力网络,得到各个对方无人机对待决策无人机的高层特征表示;
基于待决策无人机节点嵌入量的特征、待决策无人机与各个己方无人机间边嵌入量的特征,以第二图注意力网络,得到各个己方无人机对待决策无人机的高层特征表示;基于各个对方无人机对待决策无人机的高层特征表示、各个己方无人机对待决策无人机的高层特征表示,以第三神经网络,通过softmax操作,得到对待决策无人机威胁最大的对方无人机、对待决策无人机最有协同价值的己方无人机。6.根据权利要求5所述的无人机对抗策略决策方法,其特征在于,所述根据待决策无人机对抗关系图,进行待决策无人机的态势感知、信息交互,生成待决策无人机的对抗策略,具体为:基于待决策无人机节点嵌入量的特征、对待决策无人机最有协同价值的己方无人机节点嵌入量的特征、对待决策无人机威胁最大的对方无人机节点嵌入量的特征、对对待决策无人机最有协同价值己方无人机威胁最大的对方无人机节点嵌入量的特征、对待决策无人机最有协同价值的己方无人机与待决策无人机间边嵌入量的特征、对待决策无人机威胁最大的对方无人机与待决策无人机间边嵌入量的特征、对对待决策无人机最有协同价值己方无人机威胁最大的对方无人机与待决策无人机间边嵌入量的特征,以第三图注意力网络,得到待决策无人机的高层态势感知特征;将待决策无人机的高层态势感知特征、以待决策无人机为最有协同价值的己方无人机的高层态势感知特征进行交互,以第四神经网络,得到待决策无人机的高层态势感知融合特征;基于待决策无人机的高层态势感知融合特征,以第五神经网络,生成待决策无人机的对抗策略。7.根据权利要求6所述的无人机对抗策略决策方法,其特征在于,所述待决策无人机的对抗策略,包括待决策无人机的机动目标无人机、机动行为、打击目标无人机;其中,所述待决策无人机的机动行为,包括待决策无人机的水平机动方位、竖直机动方位、速度大小、过载量级。8.根据权利要求7所述的无人机对抗策略决策方法,其特征在于,还包括:将待决策无人机的对抗策略与仿真环境进行互动,采集待决策无人机的对抗策略样本;利用待决策无人机的对抗策略样本,对无人机对抗策略决策方法中的神经网络进行训练。9.根据权利要求8所述的无人机对抗策略决策方法,其特征在于,所述利用待决策无人机的对抗策略样本,对无人机对抗策略决策方法中的神经网络进行训练,具体为:利用待决策无人机的对抗策略样本,以基于近源端策略优化的强化学习算法,对无人机对抗策略决策方法中的神经网络进行训练。10.一种无人机对抗策略决策系统,其特征在于,包括:待决策无人机对抗态势抽象图构建模块,用以对待决策无人机的对抗态势进行抽象,构建待决策无人机对抗态势抽象图;
待决策无人机对抗关系图构建模块,用以根据待决策无人机对抗态势抽象图,识别对待决策无人机最重要的无人机,构建待决策无人机对抗关系图;待决策无人机的对抗策略生成模块,用以根据待决策无人机对抗关系图,进行待决策无人机的态势感知、信息交互,生成待决策无人机的对抗策略;待决策无人机的对抗策略样本采集模块,将待决策无人机的对抗策略与仿真环境进行互动,采集待决策无人机的对抗策略样本;无人机对抗策略决策神经网络训练模块,利用待决策无人机的对抗策略样本,对无人机对抗策略决策方法中的神经网络进行训练。

技术总结
本申请属于非电变量的控制或调节系统领域,具体涉及一种无人机对抗策略决策方法及其系统,其中,无人机对抗策略决策方法,包括:对待决策无人机的对抗态势进行抽象,构建待决策无人机对抗态势抽象图;根据待决策无人机对抗态势抽象图,识别对待决策无人机最重要的无人机,构建待决策无人机对抗关系图;根据待决策无人机对抗关系图,进行待决策无人机的态势感知、信息交互,生成待决策无人机的对抗策略。生成待决策无人机的对抗策略。生成待决策无人机的对抗策略。


技术研发人员:韩玥 李俊男 孙智孝 郝一行 卢长谦 彭宣淇
受保护的技术使用者:中国航空工业集团公司沈阳飞机设计研究所
技术研发日:2022.07.06
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-6451.html

最新回复(0)