1.本公开涉及人工智能技术领域,尤其涉及一种对话意图识别方法、装置和电子设备。
背景技术:2.智能对话机器人逐渐在许多商业场景中得到越来越多的应用。智能对话机器人的核心是对会话语句所表达意图的识别,这是构建智能对话机器人必不可少的基础。
3.当前对话中识别会话语句意图的技术主要通过对话中要识别的会话语句本身进行意图识别,但在很多对话中,意图的识别是和上文有紧密关系的,待识别语句的意图识别依赖于上文的信息,舍弃这些信息,在复杂情况下会影响识别的效果。
4.因此,结合对话上文意图和当前待识别语句进行对话意图识别是当前重要的研究方向。
技术实现要素:5.本公开提供一种对话意图识别方法、装置和电子设备,用以解决现有技术中只能对较少的特定语句进行判断的缺陷,实现高效、准确的结合上文的前置待识别语句对当前待识别语句进行对话意图识别,得到当前待识别语句的深层含义。
6.本公开提供一种对话意图识别方法,包括:
7.将获取的前置待识别语句输入单句对话意图识别模型,将第一输出结果作为前置对话意图类别;
8.将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将第二输出结果作为当前对话意图类别;
9.其中,所述单句对话意图识别模型是根据待识别语句样本训练得到,所述对话意图流识别模型是根据对话意图流样本训练得到。
10.根据本公开提供的一种对话意图识别方法,所述单句对话意图识别模型是通过如下步骤训练得到:
11.将所述待识别语句样本输入预构建的初始单句对话意图识别模型,输出所述单句对话意图样本类别,其中,所述待识别语句样本具有预标注的单句对话意图类别标签;
12.根据所述单句对话意图样本类别和所述预标注的单句对话意图类别标签,计算第一损失值;
13.根据所述第一损失值调整所述初始单句对话意图识别模型的第一参数,更新所述初始单句对话意图识别模型;
14.在所述第一损失值大于第一预设阈值的情况下,返回重新执行所述将所述待识别语句样本输入预构建的初始单句对话意图识别模型,输出所述单句对话意图样本类别的步骤;
15.在所述第一损失值小于等于第一预设阈值的情况下,确定更新后的所述初始单句
对话意图识别模型为所述单句对话意图识别模型。
16.根据本公开提供的一种对话意图识别方法,所述对话意图流识别模型是通过如下步骤训练得到:
17.将所述意图流样本输入预构建的初始对话意图流识别模型,输出综合对话意图样本类别,其中,所述意图流样本包括具有前后顺序的至少一个所述单句对话意图类别样本和在所述单句对话意图类别样本之后的一个待识别语句样本,所述意图流样本具有预标注的综合对话意图类别标签;
18.根据所述综合对话意图样本类别和所述预标注的综合对话意图类别标签,计算第二损失值;
19.根据所述第二损失值调整所述初始对话意图流识别模型的第二参数,更新所述初始对话意图流识别模型;
20.在所述第二损失值大于第二预设阈值的情况下,返回重新执行所述将所述意图流样本输入与构建的初始对话意图流识别模型,输出综合对话意图样本类别的步骤;
21.在所述第二损失值小于等于第二预设阈值的情况下,确定更新后的所述初始对话意图流识别模型为所述对话意图流识别模型。
22.根据本公开提供的一种对话意图识别方法,所述将所述意图流样本输入与构建的初始对话意图流识别模型的步骤之前,还包括:
23.根据具有前后顺序的至少一个所述单句对话意图类别样本和在所述单句对话意图类别之后的一个所述待识别语句样本生成意图流样本;
24.对所述意图流样本标注所述综合对话意图类别标签。
25.根据本公开提供的一种对话意图识别方法,所述前置待识别语句为多个;
26.所述将获取的前置待识别语句输入单句对话意图识别模型,将第一输出结果作为前置对话意图类别的步骤,包括:
27.获取多个前置待识别语句;
28.按照获取顺序将多个所述前置待识别语句依次输入所述单句对话意图识别模型,将所述单句对话意图识别模型输出的具有前后顺序的多个所述单句对话意图类别作为具有前后顺序的多个所述前置对话意图类别。
29.根据本公开提供的一种对话意图识别方法,所述将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将第二输出结果作为当前对话意图类别的步骤,包括:
30.将所述具有前后顺序的多个所述前置对话意图类别和获取的所述当前待识别语句输入所述对话意图流识别模型;
31.将所述对话意图流识别模型输出的所述综合对话意图类别作为所述当前对话意图类别。
32.本公开还提供一种对话意图识别装置,包括:
33.第一识别单元,用于将获取的前置待识别语句输入单句对话意图识别模型,将输出结果作为前置对话意图类别;
34.第二识别单元,用于将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将输出结果作为当前对话意图类别;
35.其中,所述单句对话意图识别模型是根据待识别语句样本以单句对话意图类别为分类依据训练得到,所述对话意图流识别模型是根据对话意图流样本以综合对话意图类别为分类依据训练得到。
36.本公开还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述对话意图识别方法的步骤。
37.本公开还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述对话意图识别方法的步骤。
38.本公开还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述对话意图识别方法的步骤
39.本公开提供的对话意图识别方法、装置和电子设备,通过将获取的前置待识别语句输入单句对话意图识别模型,将输出结果作为前置对话意图类别;将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将输出结果作为当前对话意图类别;其中,所述单句对话意图识别模型是根据待识别语句样本训练得到,所述对话意图流识别模型是根据对话意图流样本训练得到。通过对前置待识别语句进行识别获得对话中用于表示上文意图的前置对话意图类别,进一步根据前置对话意图类别和当前待识别语句进行识别,实现结合上文意图对当前待识别语句进行对话意图识别,得到当前待识别语句的深层含义。
附图说明
40.为了更清楚地说明本公开或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
41.图1是本公开提供的对话意图识别方法的流程示意图;
42.图2是本公开提供的单句对话意图识别模型的训练方法的流程示意图;
43.图3是本公开提供的初始单句对话意图识别模型的训练过程的示意图;
44.图4是本公开提供的对话意图流识别模型的训练方法的流程示意图;
45.图5是本公开提供的初始对话意图流识别模型的训练过程的流程示意图;
46.图6是本公开提供的对话意图识别装置的结构示意图;
47.图7是本公开提供的电子设备的结构示意图。
具体实施方式
48.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开实施例一部分实施例,而不是全部的实施例。基于本公开实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开实施例保护的范围。
49.智能客服机器人、智能外呼机器人和智能培训机器人等不同类型的智能对话机器
人逐渐在许多商业场景中得到越来越多的应用。智能对话机器人的核心是对会话语句所表达意图的识别,这是构建智能对话机器人必不可少的基础。
50.现在对话中会话语句的意图识别主要通过构建正则规则模板进行判断。使用正则规则模板的方式相对简单,但只能对较少的特定语句进行判断。并且在判断语句时无法结合上文内容对通用类的语句进行深层含义的判断。
51.现有技术只采用对话中要识别的会话语句本身进行意图识别,但在很多对话中,意图的识别是和上文有紧密关系的,待识别语句的意图识别依赖于上文的信息,舍弃这些信息,在复杂情况下会影响识别的效果。例如,在某个特定的意图体系中,定义两个相似的意图类别:通用类的确认和身份类的确认;两个意图类别的区别是身份类的确认是只对身份类问题的肯定回答,通用类的确认是对所有问题的肯定回答。
52.一个示例中,参考如下对话:
53.a:您好,您是张三吗?
54.b:是的。
55.此时,不使用a句信息是无法判断b句的意图类别的。另外,a的表达方式可以有很多种,例如“您好,您是张三吗?”,“喂,张三先生吗?”,“是张三张先生吗?我这里想找张先生有些事情”等等,不同的表述都表达了a的一个相同的意图,即确认张三先生的身份;如果直接使用a的字句本身,和b句一起进行b句的意图识别,会大大增加构建算法模型的复杂度和所需要的数据量。
56.因此,结合对话上文意图和当前待识别语句进行对话意图识别是当前重要的研究方向。
57.本公开提供一种对话意图识别方法,如图1所示,包括如下步骤:
58.s11、将获取的前置待识别语句输入单句对话意图识别模型,将第一输出结果作为前置对话意图类别。
59.s12、将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将第二输出结果作为当前对话意图类别。
60.其中,所述单句对话意图识别模型是根据待识别语句样本训练得到,所述对话意图流识别模型是根据对话意图流样本训练得到。
61.本公开实施例中,通过对前置待识别语句进行识别获得对话中用于表示上文意图的前置对话意图类别,进一步根据前置对话意图类别和当前待识别语句进行识别,实现结合上文意图对当前待识别语句进行对话意图识别,得到当前待识别语句的深层含义。
62.根据本公开实施例提供的一种对话意图识别方法,如图2所示,所述单句对话意图识别模型是通过如下步骤训练得到:
63.s21、将所述待识别语句样本输入预构建的初始单句对话意图识别模型,输出所述单句对话意图样本类别。
64.其中,所述待识别语句样本具有预标注的单句对话意图类别标签。
65.具体地,待识别语句样本可以是从真实对话中收集的包含各类意图的相关语料,待识别语句样本具有预标注的单句对话意图类别标签。
66.针对某个对话场景,定义多个意图的类别。类别的定义可以是根据人工经验自行定义,可以包括比较通用的类别,比如“通用类的确认”(例句:“是的”),“通用类的否定”(例
句:“不是”)等,也可以包括“身份类的确定”(例句:a:“您是张三先生吗”b:”是的”),“身份类的否定”(例句:a:“您是张三先生吗”b:“不是”)等和场景相关的定制化类别。另外,由于对话中会至少存在两个对话方,定义类别时可以对每个对话方分别定义一套意图类别,也可以所有对话方共同使用一套意图类别。
67.预构建的初始单句对话意图识别模型用于对单句语句进行识别,在真实对话中收集每类意图的相关语料,构建不考虑上文,仅使用单句的意图分类算法模型。例如:例如:预先定义的意图类别中包含“通用类的确定”的类别,则收集“是的”,“没错”等单句构成本类别的语料,用于构建初始单句对话意图识别模型。当收集语料时,碰到需要使用上文判断的意图,可以使用比较通用的意图替代即可,例如预先定义的意图类别中包含“身份类的确定”的类别,需要使用上文确认是否在询问身份,本步骤可以使用“通用类的确定”类别替代“身份类的确定”,并归属相关语料为“通用类的确定”的语料。
68.初始单句对话意图识别模型训练过程的示意图见图3。输入为对话中提取的对话语句本身,即待识别语句样本,语句被分割成词语或者字符后输入模型中;初始单句对话意图识别模型结构是一个分类模型,可以采用但不限于textcnn、bilstm或者bert等通常使用的分类模型结构,输出为预标注的多个单句对话意图类别标签中最可能的一个类别。例如:待识别语句样本为“是的”,经初始单句对话意图识别模型后,输出的单句对话意图样本类别为“通用类的确定”。
69.s22、根据所述单句对话意图样本类别和所述预标注的单句对话意图类别标签,计算第一损失值。
70.s23、根据所述第一损失值调整所述初始单句对话意图识别模型的第一参数,更新所述初始单句对话意图识别模型。
71.s24、在所述第一损失值大于第一预设阈值的情况下,返回重新执行所述将所述待识别语句样本输入预构建的初始单句对话意图识别模型,输出所述单句对话意图样本类别的步骤。
72.具体地,当第一损失值大于第一预设阈值时,可以返回重新执行步骤s21-s23的操作。
73.s25、在所述第一损失值小于等于第一预设阈值的情况下,确定更新后的所述初始单句对话意图识别模型为所述单句对话意图识别模型。
74.本公开实施例中,详细记述了预构建的初始单句对话意图识别模型的构造原理,以及如何根据待识别语句样本训练初始单句对话意图识别模型,最终得到性能较好的单句对话意图识别模型。进而方便后续根据单句对话意图识别模型高效、准确地对前置待识别语句进行识别,得到前置对话意图类别。
75.根据本公开实施例提供的一种对话意图识别方法,如图4所示,所述对话意图流识别模型是通过如下步骤训练得到:
76.s41、将所述意图流样本输入预构建的初始对话意图流识别模型,输出综合对话意图样本类别。
77.其中,所述意图流样本包括具有前后顺序的至少一个所述单句对话意图类别样本和在所述单句对话意图类别样本之后的一个待识别语句样本,所述意图流样本具有预标注的综合对话意图类别标签。
78.具体地,意图流样本包括前后两部分,前部分为具有顺序的至少一个单句对话意图类别样本,用于表示一个对话中的上文的意图,后部分为一个待识别语句样本,用于表示一个对话中的当前需要对其进行意图识别的语句。
79.其中,前部分的具有顺序的至少一个单句对话意图类别样本可以通过将一个对话中的上文输入上述单句对话意图识别模型获得。
80.一个示例中,例如在下面对话中:
81.a1:喂,您好!
82.b1:您好!
83.a2:我是客服,您是张三先生吗?
84.b2:是的。
85.当b2句作为待识别意图类别的语句时,a1-b1-a2为b2的上文,使用上述单句对话意图识别模型转换a1-b1-a2文本为“问候-问候-确认身份”,这里“问候”,”确认身份”都在预先定义的意图类别内。
86.前部分的具有顺序的至少一个单句对话意图类别样本也可以为人工进行设定意图类别。
87.预先定义的类别中包含“身份类的确定”的意图类别,收集“问候-问候-确认身份”的三个单句对话意图类别样本和待识别语句样本“是的”一起作为构成本类别的语料。对于上文的意图类别选择可以根据经验自行决定,即可以使用“问候-问候-确认身份”作为上文的意图,也可不使用所有上文,仅使用“确认身份”作为上文的意图,收集“确认身份”的单据对话意图类别样本和待识别语句样本“是的”构成“身份类的确定”的意图类别。
88.初始对话意图流识别模型训练过程的示意图见图5。输入为单句对话意图类别样本和待识别语句样本组成的字符串,其被分割成词语或者字符后输入初始对话意图流识别模型中;初始对话意图流识别模型的结构是一个分类模型,可以采用但不限于textcnn、bilstm或者bert等通常使用的分类模型结构;输出预先定义的意图类别中最可能的一个类别,得到综合对话意图样本类别。
89.所以上述对话示例中,结合a1-b1-a2对应的单句对话意图类别样本“问候-问候-确认身份”和b2句本身输入模型后,模型输出“身份类的确定”的综合对话意图样本类别,作为b2句的意图识别结果。
90.s42、根据所述综合对话意图样本类别和所述预标注的综合对话意图类别标签,计算第二损失值。
91.s43、根据所述第二损失值调整所述初始对话意图流识别模型的第二参数,更新所述初始对话意图流识别模型。
92.s44、在所述第二损失值大于第二预设阈值的情况下,返回重新执行所述将所述意图流样本输入与构建的初始对话意图流识别模型,输出综合对话意图样本类别的步骤。
93.具体地,在第二损失值大于第二预设阈值时,可以返回重新执行步骤s41-s43的操作。
94.s45、在所述第二损失值小于等于第二预设阈值的情况下,确定更新后的所述初始对话意图流识别模型为所述对话意图流识别模型。
95.本公开实施例中,详细记述了预构建的对话意图流识别模型的构造原理,以及如
何根据意图流样本训练初始对话意图流识别模型,最终得到性能较好的对话意图流识别模型。进而方便后续根据对话意图流识别模型高效、准确地对前置对话意图类别和当前待识别语句进行识别,得到当前对话意图类别。
96.根据本公开实施例提供的一种对话意图识别方法,在步骤s41之前还包括:
97.s411、根据具有前后顺序的至少一个所述单句对话意图类别样本和在所述单句对话意图类别之后的一个所述待识别语句样本生成意图流样本。
98.s412、对所述意图流样本标注所述综合对话意图类别标签。
99.具体地,可以根据具有前后顺序的至少一个单句对话意图类别样本和在单句对话意图类别之后的一个待识别语句样本生成意图流样本。单句对话意图类别样本可以通过将一个对话中的上文逐句输入上述单句对话意图识别模型获得,也可以人工设定意图类别作为单句对话意图类别样本。
100.在生成意图流样本后,可以人工对意图流样本标注综合对话意图类别标签。
101.本公开实施例中,根据具有前后顺序的至少一个单句对话意图类别样本和之后的一个待识别语句样本生成意图流样本,并对意图流样本标注综合对话意图类别标签,方便后续将意图流样本输入初始对话意图流识别模型识别,进而方便了训练初始对话意图流识别模型,得到初始对话意图流识别模型。
102.根据本公开实施例提供的一种对话意图识别方法,所述前置待识别语句为多个;所述步骤s11包括:
103.s111、获取多个前置待识别语句。
104.s112、按照获取顺序将多个所述前置待识别语句依次输入所述单句对话意图识别模型,将所述单句对话意图识别模型输出的具有前后顺序的多个所述单句对话意图类别作为具有前后顺序的多个所述前置对话意图类别。
105.具体地,一个示例中,例如在下面对话中:
106.a1:喂,您好!
107.b1:您好!
108.a2:我是客服,您是张三先生吗?
109.b2:是的。
110.此时,b2句为最后的语句,即为当前待识别语句,a1、b1和a2均为b2的前置待识别语句,将a1、b1、a2语句按照a1-b1-a2的顺序依次输入单句对话意图识别模型,最终得到具有顺序的“问候-问候-确认身份”的三个前置对话意图类别。
111.本公开实施例中,前置待识别语句为多个,将多个待识别语句按照获取顺序输入单句对话意图识别模型,得到具有前后顺序的多个前置对话意图类别,方便后续根据前置对话意图类别对当前待识别语句的意图类别进行识别。
112.根据本公开实施例提供的一种对话意图识别方法,步骤s12包括:
113.s121、将所述具有前后顺序的多个所述前置对话意图类别和获取的所述当前待识别语句输入所述对话意图流识别模型;
114.s122、将所述对话意图流识别模型输出的所述综合对话意图类别作为所述当前对话意图类别。
115.具体地,一个示例中,例如在下面对话中:
116.a1:喂,您好!
117.b1:您好!
118.a2:我是客服,您是张三先生吗?
119.b2:是的。
120.将a1-b1-a2语句依次输入单句对话意图识别模型后,得到具有顺序的“问候-问候-确认身份”的三个前置对话意图类别。此时,将“问候-问候-确认身份”的三个前置对话意图类别和当前待识别语句b2输入对话意图流识别模型。经过对话意图流识别模型后,输出综合对话意图类别,将综合对话意图类别作为b2语句的意图类别,即当前对话意图类别。
121.本公开实施例中,将具有前后顺序的多个前置对话意图类别和当前待识别语句输入对话意图流识别模型,经过对话意图流识别模型输出当前对话意图类别,实现高效、准确的结合上文的前置待识别语句对当前待识别语句进行对话意图识别,得到当前待识别语句的深层含义。
122.下面对本公开实施例提供的对话意图识别装置进行描述,下文描述的对话意图识别装置与上文描述的对话意图识别方法可相互对应参照。
123.本公开实施例还提供一种对话意图识别装置,如图6所示,包括:
124.第一识别单元61,用于将获取的前置待识别语句输入单句对话意图识别模型,将输出结果作为前置对话意图类别。
125.第二识别单元62,用于将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将输出结果作为当前对话意图类别。
126.其中,所述单句对话意图识别模型是根据待识别语句样本以单句对话意图类别为分类依据训练得到,所述对话意图流识别模型是根据对话意图流样本以综合对话意图类别为分类依据训练得到。
127.本公开实施例中,通过对前置待识别语句进行识别获得对话中用于表示上文意图的前置对话意图类别,进一步根据前置对话意图类别和当前待识别语句进行识别,实现结合上文意图对当前待识别语句进行对话意图识别,得到当前待识别语句的深层含义。
128.根据本公开实施例提供的一种对话意图识别装置,所述单句对话意图识别模型是通过如下步骤训练得到:
129.将所述待识别语句样本输入预构建的初始单句对话意图识别模型,输出所述单句对话意图样本类别;
130.根据所述单句对话意图样本类别和所述预标注的单句对话意图类别标签,计算第一损失值;
131.根据所述第一损失值调整所述初始单句对话意图识别模型的第一参数,更新所述初始单句对话意图识别模型;
132.在所述第一损失值大于第一预设阈值的情况下,返回重新执行所述将所述待识别语句样本输入预构建的初始单句对话意图识别模型,输出所述单句对话意图样本类别的步骤;
133.在所述第一损失值小于等于第一预设阈值的情况下,确定更新后的所述初始单句对话意图识别模型为所述单句对话意图识别模型。
134.根据本公开实施例提供的一种对话意图识别装置,所述对话意图流识别模型是通
过如下步骤训练得到:
135.将所述意图流样本输入预构建的初始对话意图流识别模型,输出综合对话意图样本类别;
136.根据所述综合对话意图样本类别和所述预标注的综合对话意图类别标签,计算第二损失值;
137.根据所述第二损失值调整所述初始对话意图流识别模型的第二参数,更新所述初始对话意图流识别模型;
138.在所述第二损失值大于第二预设阈值的情况下,返回重新执行所述将所述意图流样本输入与构建的初始对话意图流识别模型,输出综合对话意图样本类别的步骤;
139.在所述第二损失值小于等于第二预设阈值的情况下,确定更新后的所述初始对话意图流识别模型为所述对话意图流识别模型。
140.根据本公开实施例提供的一种对话意图识别装置,所述将所述意图流样本输入预构建的初始对话意图流识别模型,输出综合对话意图样本类别的步骤之前,还包括:
141.根据具有前后顺序的至少一个所述单句对话意图类别样本和在所述单句对话意图类别之后的一个所述待识别语句样本生成意图流样本;
142.对所述意图流样本标注所述综合对话意图类别标签。
143.根据本公开实施例提供的一种对话意图识别装置,所述前置待识别语句为多个;
144.所述第一识别单元61,具体用于:获取多个前置待识别语句;按照获取顺序将多个所述前置待识别语句依次输入所述单句对话意图识别模型,将所述单句对话意图识别模型输出的具有前后顺序的多个所述单句对话意图类别作为具有前后顺序的多个所述前置对话意图类别。
145.根据本公开实施例提供的一种对话意图识别装置,所述第二识别单元62,具体用于:将所述具有前后顺序的多个所述前置对话意图类别和获取的所述当前待识别语句输入所述对话意图流识别模型;将所述对话意图流识别模型输出的所述综合对话意图类别作为所述当前对话意图类别。
146.图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(communications interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行对话意图识别方法,该方法包括:将获取的前置待识别语句输入单句对话意图识别模型,将第一输出结果作为前置对话意图类别;将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将第二输出结果作为当前对话意图类别;其中,所述单句对话意图识别模型是根据待识别语句样本训练得到,所述对话意图流识别模型是根据对话意图流样本训练得到。
147.此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器
(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
148.另一方面,本公开还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的对话意图识别方法,该方法包括:将获取的前置待识别语句输入单句对话意图识别模型,将第一输出结果作为前置对话意图类别;将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将第二输出结果作为当前对话意图类别;其中,所述单句对话意图识别模型是根据待识别语句样本训练得到,所述对话意图流识别模型是根据对话意图流样本训练得到。
149.又一方面,本公开还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的对话意图识别方法,该方法包括:将获取的前置待识别语句输入单句对话意图识别模型,将第一输出结果作为前置对话意图类别;将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将第二输出结果作为当前对话意图类别;其中,所述单句对话意图识别模型是根据待识别语句样本训练得到,所述对话意图流识别模型是根据对话意图流样本训练得到。
150.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
151.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
152.最后应说明的是:以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围。
技术特征:1.一种对话意图识别方法,其特征在于,包括:将获取的前置待识别语句输入单句对话意图识别模型,将第一输出结果作为前置对话意图类别;将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将第二输出结果作为当前对话意图类别;其中,所述单句对话意图识别模型是根据待识别语句样本训练得到,所述对话意图流识别模型是根据对话意图流样本训练得到。2.根据权利要求1所述的对话意图识别方法,其特征在于,所述单句对话意图识别模型是通过如下步骤训练得到:将所述待识别语句样本输入预构建的初始单句对话意图识别模型,输出所述单句对话意图样本类别,其中,所述待识别语句样本具有预标注的单句对话意图类别标签;根据所述单句对话意图样本类别和所述预标注的单句对话意图类别标签,计算第一损失值;根据所述第一损失值调整所述初始单句对话意图识别模型的第一参数,更新所述初始单句对话意图识别模型;在所述第一损失值大于第一预设阈值的情况下,返回重新执行所述将所述待识别语句样本输入预构建的初始单句对话意图识别模型,输出所述单句对话意图样本类别的步骤;在所述第一损失值小于等于第一预设阈值的情况下,确定更新后的所述初始单句对话意图识别模型为所述单句对话意图识别模型。3.根据权利要求2所述的对话意图识别方法,其特征在于,所述对话意图流识别模型是通过如下步骤训练得到:将所述意图流样本输入预构建的初始对话意图流识别模型,输出综合对话意图样本类别,其中,所述意图流样本包括具有前后顺序的至少一个所述单句对话意图类别样本和在所述单句对话意图类别样本之后的一个待识别语句样本,所述意图流样本具有预标注的综合对话意图类别标签;根据所述综合对话意图样本类别和所述预标注的综合对话意图类别标签,计算第二损失值;根据所述第二损失值调整所述初始对话意图流识别模型的第二参数,更新所述初始对话意图流识别模型;在所述第二损失值大于第二预设阈值的情况下,返回重新执行所述将所述意图流样本输入与构建的初始对话意图流识别模型,输出综合对话意图样本类别的步骤;在所述第二损失值小于等于第二预设阈值的情况下,确定更新后的所述初始对话意图流识别模型为所述对话意图流识别模型。4.根据权利要求3所述的对话意图识别方法,其特征在于,所述将所述意图流样本输入与构建的初始对话意图流识别模型的步骤之前,还包括:根据具有前后顺序的至少一个所述单句对话意图类别样本和在所述单句对话意图类别之后的一个所述待识别语句样本生成意图流样本;对所述意图流样本标注所述综合对话意图类别标签。5.根据权利要求4所述的对话意图识别方法,其特征在于,所述前置待识别语句为多
个;所述将获取的前置待识别语句输入单句对话意图识别模型,将第一输出结果作为前置对话意图类别的步骤,包括:获取多个前置待识别语句;按照获取顺序将多个所述前置待识别语句依次输入所述单句对话意图识别模型,将所述单句对话意图识别模型输出的具有前后顺序的多个所述单句对话意图类别作为具有前后顺序的多个所述前置对话意图类别。6.根据权利要求5所述的对话意图识别方法,其特征在于,所述将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将第二输出结果作为当前对话意图类别的步骤,包括:将所述具有前后顺序的多个所述前置对话意图类别和获取的所述当前待识别语句输入所述对话意图流识别模型;将所述对话意图流识别模型输出的所述综合对话意图类别作为所述当前对话意图类别。7.一种对话意图识别装置,其特征在于,包括:第一识别单元,用于将获取的前置待识别语句输入单句对话意图识别模型,将输出结果作为前置对话意图类别;第二识别单元,用于将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将输出结果作为当前对话意图类别;其中,所述单句对话意图识别模型是根据待识别语句样本以单句对话意图类别为分类依据训练得到,所述对话意图流识别模型是根据对话意图流样本以综合对话意图类别为分类依据训练得到。8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述对话意图识别方法的步骤。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述对话意图识别方法的步骤。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述对话意图识别方法的步骤。
技术总结本公开提供一种对话意图识别方法、装置和电子设备,方法包括:将获取的前置待识别语句输入单句对话意图识别模型,将第一输出结果作为前置对话意图类别;将所述前置对话意图类别和获取的当前待识别语句输入对话意图流识别模型,将第二输出结果作为当前对话意图类别;其中,所述单句对话意图识别模型是根据待识别语句样本训练得到,所述对话意图流识别模型是根据对话意图流样本训练得到。实现高效、准确的结合上文的前置待识别语句对当前待识别语句进行对话意图识别,得到当前待识别语句的深层含义。层含义。层含义。
技术研发人员:胡晓亮 闫慧丽 倪云 季圣哲 邱志明
受保护的技术使用者:京东科技信息技术有限公司
技术研发日:2022.07.21
技术公布日:2022/11/1