1.本公开涉及人工智能技术领域,尤其涉及一种会话管理方法、装置和电子设备。
背景技术:2.智能对话机器人逐渐在许多商业场景中得到越来越多的应用。绝大多数复杂的智能对话机器人的核心之一是会话管理,即在人机对话中,机器人在接收到真人一方的信息后,根据此信息选择应答话术回复真人一方。
3.复杂的场景下,配置对话机器人的会话管理是一个工作量巨大且繁琐的工作。需要针对会话中可能发生的各种情况,根据人工经验设定与特定真人语句对应的机器人应答语句,在对话机器人接收真人语句后选择应答语句进行应答来完成会话管理,导致人工配置工作量巨大,并且在对语句应答时大概率选择不符合逻辑的应答话术。
4.因此,提供一种高效和准确的会话管理方法是当前亟待解决的重要问题。
技术实现要素:5.本公开提供一种会话管理方法、装置和电子设备,用以解决现有技术中根据待识别语句应答时大概率选择不符合逻辑的应答话术的缺陷,实现准确、快速地根据待识别语句选择符合逻辑的应答话术。
6.本公开提供一种会话管理方法,包括:
7.将获取的待识别语句输入意图识别模型,输出第一意图数据;
8.根据所述第一意图数据在意图流数据库中确定对应的目标意图流数据中的目标意图数据的后置意图数据,所述意图流数据库由多个意图流数据组成,所述意图流数据由具有顺序的多个意图数据组成,所述后置意图数据为在所述意图流数据中与所述目标意图数据相邻且排序靠后的意图数据;
9.根据所述后置意图数据在应答话术数据库中按照预设映射关系进行匹配,得到至少一个候选话术数据;
10.将所述第一意图数据和至少一个所述候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据。
11.根据本公开提供的一种会话管理方法,所述意图识别模型是通过如下步骤训练得到的,包括:
12.将待识别语句样本输入预构建的初始意图识别模型,输出对话意图类别样本,其中,所述待识别语句样本具有预标注的所述对话意图类别标签;
13.根据所述对话意图类别样本和所述预标注的对话意图类别标签,计算第一损失值;
14.根据所述第一损失值调整所述初始意图识别模型的第一参数,更新所述初始意图识别模型;
15.在所述第一损失值大于第一预设阈值的情况下,返回重新执行所述将待识别语句
样本输入预构建的初始意图识别模型,输出对话意图类别样本的步骤;
16.在所述第一损失值小于等于第一预设阈值的情况下,确定更新后的所述初始意图识别模型为意图识别模型。
17.根据本公开提供的一种会话管理方法,所述根据所述第一意图数据在意图流数据库中确定对应的目标意图流数据中的目标意图数据的后置意图数据的步骤,包括:
18.根据所述第一意图数据在所述意图流数据库中匹配与之对应的目标意图数据;
19.根据所述目标意图数据,确定目标意图流数据;
20.将所述目标意图流数据中与所述目标意图数据相邻且排序靠后的意图数据确定为后置意图数据。
21.根据本公开提供的一种会话管理方法,所述话术选择模型是通过如下步骤训练得到的,包括:
22.将话术选择样本输入初始话术选择模型,输出样本分类标签和所述样本分类标签对应的概率,其中,所述话术选择样本包括意图数据样本和候选话术数据样本,所述话术选择样本具有预标注的预分类标签;
23.根据所述样本分类标签、所述样本分类标签对应的概率和所述预标注的分类标签,计算第二损失值;
24.根据所述第二损失值调整所述初始话术选择模型的第二参数,更新所述初始话术选择模型;
25.在所述第二损失值大于第二预设阈值的情况下,返回重新执行所述将话术选择样本输入初始话术选择模型,输出样本分类标签和所述样本分类标签对应的概率的步骤;
26.在所述第二损失值小于等于所述第二预设阈值的情况下,确定更新后的所述初始话术选择模型为所述话术选择模型。
27.根据本公开提供的一种会话管理方法,所述将所述第一意图数据和至少一个所述候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据的步骤,包括:
28.对于每一个所述候选话术数据,将所述第一意图数据和所述候选话术数据作为一个待识别数据,得到至少一个所述待识别数据;
29.将所述至少一个待识别数据逐个输入所述话术选择模型,得到至少一个分类标签和与所述分类标签对应的概率;
30.根据预设规则选取指定类别的分类标签作为目标应答标签,得到至少一个目标应答标签;
31.根据至少一个所述目标应答标签对应的概率和对应的所述候选话术数据,确定目标应答话术数据。
32.根据本公开提供的一种会话管理方法,所述根据至少一个所述目标应答标签对应的概率和对应的所述候选话术数据,确定目标应答话术数据的步骤,包括:
33.在至少一个所述目标应答标签中,将所述分类标签对应的概率最大的目标应答标签对应的所述候选话术数据确定为目标应答话术数据。
34.本公开还提供一种会话管理装置,包括:
35.意图识别单元,用于将获取的待识别语句输入意图识别模型,输出第一意图数据;
36.第一匹配单元,用于根据所述第一意图数据在意图流数据库中确定对应的目标意
图流数据中的目标意图数据的后置意图数据,所述意图流数据库由多个意图流数据组成,所述意图流数据由具有顺序的多个意图数据组成,所述后置意图数据为在所述意图流数据中与所述目标意图数据相邻且排序靠后的意图数据;
37.第二匹配单元,用于根据所述后置意图数据在所述应答话术数据库中按照预设映射关系进行匹配,得到至少一个候选话术数据;
38.确定单元,用于将所述第一意图数据和至少一个所述候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据。
39.本公开还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述会话管理方法的步骤。
40.本公开还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述会话管理方法的步骤。
41.本公开还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述会话管理方法的步骤。
42.本公开提供的会话管理方法、装置和电子设备,通过将待识别语句输入意图识别模型初步确定待识别语句的意图,并根据待识别语句的意图确定符合逻辑的后置意图,将后置意图和与后置意图对应的至少一个候选话术输入话术选择模型,通过话术选择模型选择符合逻辑的目标应答话术。从真实对话数据中通过意图流的方式可以包括尽可能多的节点和路径,数量级上远大于人工配置和规则总结的方式,尤其可以覆盖更多的长尾情况。应用话术选择模型用于配置节点上的目标应答话术,大概率符合对话上文的逻辑,避免了人工配置时很大程度上难以控制对话逻辑的问题,可以大大降低人工配置的工作量和周期,实现准确、快速地根据待识别语句选择符合逻辑的应答话术。
附图说明
43.为了更清楚地说明本公开或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
44.图1是本公开提供的会话管理方法的流程示意图;
45.图2是本公开提供的意图识别模型的训练方法的流程示意图;
46.图3是本公开提供的初始意图识别模型的训练过程的示意图;
47.图4是本公开提供的话术选择模型的训练方法的流程示意图;
48.图5是本公开提供的初始话术选择模型的训练过程的示意图;
49.图6是本公开提供的会话管理装置的结构示意图;
50.图7是本公开提供的电子设备的结构示意图。
具体实施方式
51.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是
本公开实施例一部分实施例,而不是全部的实施例。基于本公开实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开实施例保护的范围。
52.智能客服机器人、智能外呼机器人和智能培训机器人等不同类型的智能对话机器人逐渐在许多商业场景中得到越来越多的应用。绝大多数复杂的智能对话机器人的核心之一是会话管理,即在人机对话中,机器人接收到真人一方的信息后,对此信息做出反应,并回馈对于信息给真人一方的管理系统。智能对话机器人交互的方式可以包括文字和语音等不同的方式,但绝大多数情况下,即使使用文字以外的交互方式,例如语音,都会转换为文本的形式输入到会话管理,会话管理也会输出反馈的文本,再转换为语音等反馈给用户。
53.复杂的场景下,配置对话机器人的会话管理是一个工作量巨大且繁琐的工作。需要针对会话中可能发生的各种情况,从人机对话的第一轮一直配置到会话结束。构建针对某一个特定场景的对话机器人会话管理,通常的基本方式有:1)熟悉特定场景的专业人员根据经验人工构建会话管理,即根据经验专业人员预想可能发生的情况,配置机器人每轮对话中可能的应答,从而形成会话管理系统;2)利用相同场景下已有的真人间对话数据,统计和人工总结相应的规则,配置每轮对话中可能的应答,从而形成机器人会话管理系统。
54.复杂的场景下,配置对话机器人的会话管理是一个工作量巨大且繁琐的工作。需要针对会话中可能发生的各种情况,根据人工经验设定与特定真人语句对应的机器人应答语句,在对话机器人接收真人语句后选择应答语句进行应答来完成会话管理,导致人工配置工作量巨大,并且在对语句应答时大概率选择不符合逻辑的应答话术。
55.表1:外呼客服机器人对话示例
[0056][0057]
如果要实现表1中的人机对话,绝大多数情况下,需要通过预先配置会话管理的方式实现。会话管理系统通常以节点和路径的方式构成。节点通常包括真人方的真人意图,和机器人针对该意图回应的话术,路径表示如何连接这些节点。针对表1示例中外呼客服机器人场景,会话管理系统可以配置两个节点,会话初始节点(真人意图:无;回应话术:喂,您
好!),另一个节点(真人意图:问候;回应话术:您是张三先生吗?)。对话中机器人在对话初始的时候使用初始节点,(对应表1中第一轮,)真人方针对机器人方的话术“喂,您好!”,回应了”喂”,(对应表1中第二轮,)它对应的意图是”问候”,连接了上述两个节点,便在对话管理内形成了一个路径。但如果真人方针对第一轮机器人的话术回应了其他语句,比如“不是”,这就需要预先在会话管理系统内配置一个应当这种情况的节点,并连接初始节点和这个新节点。
[0058]
对于复杂的场景,对话的轮次远远大于二轮以上,这会使会话管理系统内配置节点和路径的空间非常巨大。不管是熟悉特定场景的专业人员根据经验手工构建,还是从这个场景的真人间对话中统计和总结规则,都会面临只能覆盖经常发生的情况,大概率产生不符合逻辑的应答话术,人工配置工作量巨大,周期长等诸多严峻挑战。
[0059]
因此,提供一种高效和准确的会话管理方法是当前亟待解决的重要问题。
[0060]
为解决上述问题,本公开提供一种会话管理方法,如图1所示,包括:
[0061]
s11、将获取的待识别语句输入意图识别模型,输出第一意图数据。
[0062]
s12、根据所述第一意图数据在意图流数据库中确定对应的目标意图流数据中的目标意图数据的后置意图数据。
[0063]
其中,所述意图流数据库由多个意图流数据组成,所述意图流数据由具有顺序的多个意图数据组成,所述后置意图数据为在所述意图流数据中与所述目标意图数据相邻且排序靠后的意图数据。
[0064]
具体地,可以根据针对某个特定会话场景,准备真人之间的对话数据,根据会话场景的自身特点,定义会话意图的类别体系,即归属对话中的每轮对话文本到一个预定好的类别下面。意图的类别一旦定义,类别数量和定义不会再变化。另外,由于对话中会至少存在两个对话方,定义类别时可以为每个对话方分别定义一套意图类别,也可以所有对话方共同使用一套意图类别。将真人之间的对话转变为对应意图类别的意图数据。
[0065]
一个示例中,构成意图流数据库的一图流数据中的意图数据,可以是由上述意图识别模型对真人之间的对话数据进行识别得到。如表1示例,可以使用意图分类模型将对话转为多个意图组成的意图流,“机器人意图:问候
–
真人意图:问候
–
机器人意图:确认身份
–
真人意图:确认并询问来意
–
机器人意图:表明目的
–
真人意图:确认
‑…‑
机器人意图:结束”。大量的真人对话转换为意图流的形式后,组成了一个意图流库,意图流库内意图流数量可随时增加。
[0066]
s13、根据所述后置意图数据在应答话术数据库中按照预设映射关系进行匹配,得到至少一个候选话术数据。
[0067]
具体地,针对某个特定会话场景,在机器人应答意图类别和定义确定后,构建每个意图下的应答话术集,组成应答话术数据库。应答话术通常从准备的真人对话数据中手工整理得到。每个意图类别的话术数量可自行决定,与特定的会话场景,意图类别的体系定义,以及真人对话数据的数量有关。应答话术数据库里的具体话术可以随时增加。
[0068]
s14、将所述第一意图数据和至少一个所述候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据。
[0069]
本公开实施例中,通过将待识别语句输入意图识别模型初步确定待识别语句的意图,并根据待识别语句的意图确定符合逻辑的后置意图,将后置意图和与后置意图对应的
至少一个候选话术输入话术选择模型,通过话术选择模型选择符合逻辑的目标应答话术。从真实对话数据中通过意图流的方式可以包括尽可能多的节点和路径,数量级上远大于人工配置和规则总结的方式,尤其可以覆盖更多的长尾情况。应用话术选择模型用于配置节点上的目标应答话术,大概率符合对话上文的逻辑,避免了人工配置时很大程度上难以控制对话逻辑的问题,可以大大降低人工配置的工作量和周期,实现准确、快速地根据待识别语句选择符合逻辑的应答话术。
[0070]
根据本公开提供的会话管理方法,如图2所示,所述意图识别模型是通过如下步骤训练得到的,包括:
[0071]
s21、将待识别语句样本输入预构建的初始意图识别模型,输出对话意图类别样本。
[0072]
其中,所述待识别语句样本具有预标注的所述对话意图类别标签。
[0073]
具体地,如图3所示,预构建的初始意图识别模型的结构是一个分类模型,可以采用但不限于textcnn、bilstm或者bert等通常使用的分类模型结构,输入待识别语句样本,输出预先定义的意图类别中最可能的对话意图类别,即对话意图类别样本。例如:待识别语句样本为“好的”,经初始意图识别模型,输出对话意图类别样本为“确认”。
[0074]
s22、根据所述对话意图类别样本和所述预标注的对话意图类别标签,计算第一损失值。
[0075]
s23、根据所述第一损失值调整所述初始意图识别模型的第一参数,更新所述初始意图识别模型。
[0076]
s24、在所述第一损失值大于第一预设阈值的情况下,返回重新执行所述将待识别语句样本输入预构建的初始意图识别模型,输出对话意图类别样本的步骤。
[0077]
具体地,在第一损失值大于第一预设阈值时,可以返回重新执行步骤s21-s23的操作。
[0078]
s25、在所述第一损失值小于等于第一预设阈值的情况下,确定更新后的所述初始意图识别模型为意图识别模型。
[0079]
本公开实施例中,详细记述了预构建的初始意图识别模型的构造原理,以及如何根据待识别语句样本训练初始意图识别模型,最终得到性能较好的意图识别模型。进而方便后续根据意图识别模型高效、准确地对待识别语句进行识别,得到第一意图数据。
[0080]
根据本公开提供的会话管理方法,步骤s12具体包括:
[0081]
s121、根据所述第一意图数据在所述意图流数据库中匹配与之对应的目标意图数据。
[0082]
s122、根据所述目标意图数据,确定目标意图流数据。
[0083]
s123、将所述目标意图流数据中与所述目标意图数据相邻且排序靠后的意图数据确定为后置意图数据。
[0084]
具体地,由于意图流数据库由多个意图流数据组成,意图流数据又由具有顺序的多个意图数据组成。可以根据第一意图数据在意图流数据库中匹配对应的意图数据作为目标意图数据,根据目标意图数据确定目标意图数据所在的意图流数据为目标意图流数据,在目标意图流数据中查找与目标意图数据相邻且排序靠后的意图数据,将其确定为后置意图数据。
[0085]
本公开实施例中,根据第一意图数据在意图流数据库中匹配目标意图数据,根据目标意图数据确定目标意图流数据,根据目标一图刘数据和目标意图数据确定后置意图数据。由于意图流数据中各意图数据是根据逻辑整理获得并根据逻辑进行了排序,确定的后置意图数据对应的对话意图是与对话上文的第一意图数据要表示的对话意图符合逻辑的,进而实现确定符合逻辑的后置意图数据。
[0086]
根据本公开提供的会话管理方法,如图4所示,所述话术选择模型是通过如下步骤训练得到的,包括:
[0087]
s41、将话术选择样本输入初始话术选择模型,输出样本分类标签和所述样本分类标签对应的概率。
[0088]
其中,所述话术选择样本包括意图数据样本和候选话术数据样本,所述话术选择样本具有预标注的预分类标签。
[0089]
具体地,初始话术选择模型训练过程的示意图见图5。输入为话术选择样本组成的字符串,话术选择样本包括意图数据样本和候选话术数据样本,话术选择样本被分割成词语或者字符后输入模型中,初始话术选择模型的结构是一个分类模型,可以采用但不限于textcnn、bilstm或者bert等通常使用的分类模型结构,输出为样本分类标签,以及样本分类标签的概率。
[0090]
如表1的示例,如果已有1-4轮的对话,判断第5轮选择的话术是否合适。1-4轮对话的意图流为,机器人意图:问候
–
真人意图:问候
–
机器人意图:确认身份
–
真人意图:确认并询问来意。如果第5轮的话术选择“这里是客服,您在我们这里办理了一项业务,想和您确认一下相关信息”,是符合当前的对话逻辑,被标记为符合的类别,相反如果选择重复第3轮的话术“您是张三先生吗?”,就是不符合当前的对话逻辑,被标记为不符合的类别。针对某个特定会话场景,利用真人之间的对话数据,可以构建训练初始话术选择模型的语料即话术选择样本,用于训练初始话术选择模型。
[0091]
对于话术选择样本中对话的语料的选择,可以根据经验自行决定,即可以使用从对话开始到当前完整的意图流,也可以仅使用完整意图流的一部分,即最后一个意图。
[0092]
话术选择样本包括意图数据样本和候选话术数据样本,话术选择样本具有预标注的预分类标签,预分类标签可以根据需要进行设定,一个示例中,预分类标签可以包括“符合逻辑”和“不符合逻辑”标签,另一个示例中,预分类标签还可以包括“确认身份”和“表明目的”等标签。
[0093]
s42、根据所述样本分类标签、所述样本分类标签对应的概率和所述预标注的分类标签,计算第二损失值。
[0094]
s43、根据所述第二损失值调整所述初始话术选择模型的第二参数,更新所述初始话术选择模型。
[0095]
s44、在所述第二损失值大于第二预设阈值的情况下,返回重新执行所述将话术选择样本输入初始话术选择模型,输出样本分类标签和所述样本分类标签对应的概率的步骤。
[0096]
具体地,在第二损失值大于第二预设阈值时,可以返回重新执行步骤s41-s43的操作。
[0097]
s45、在所述第二损失值小于等于所述第二预设阈值的情况下,确定更新后的所述
初始话术选择模型为所述话术选择模型。
[0098]
本公开实施例中,详细记述了预构建的初始话术选择模型的构造原理,以及如何根据话术选择样本训练初始话术选择模型,最终得到性能较好的话术选择模型。进而方便后续根据话术选择模型高效、准确地对第一意图数据和候选话术数据进行识别,得到目标应答话术数据。
[0099]
根据本公开提供的会话管理方法,步骤s14具体可以包括:
[0100]
s141、对于每一个所述候选话术数据,将所述第一意图数据和所述候选话术数据作为一个待识别数据,得到至少一个所述待识别数据。
[0101]
具体地,一个示例中,根据第一意图数据和预设映射关系获取到一个候选话术数据,将第一意图数据和该候选话术数据作为一个待识别数据。
[0102]
另一个示例中,在根据第一意图数据和预设映射关系获取到多个候选话术数据。将每一个候选话术数据和第一意图数据作为一个待识别数据,得到多个待识别数据。
[0103]
s142、将所述至少一个待识别数据逐个输入所述话术选择模型,得到至少一个分类标签和与所述分类标签对应的概率。
[0104]
具体地,一个示例中,待识别数据为多个,对于每一个待识别数据,将待识别数据输入话术选择模型,得到这一个待识别数据的分类标签以及识别为该分类标签的概率。
[0105]
s143、根据预设规则选取指定类别的分类标签作为目标应答标签,得到至少一个目标应答标签。
[0106]
具体地,一个示例中,通过步骤s142得到多个“符合逻辑”的分类标签和多个“不符合逻辑”的分类标签,可以根据预设规则选取“符合逻辑”的分类标签作为目标应答标签。
[0107]
另一个示例中,通过步骤s142得到多个“确认身份”的分类标签和多个“表明目的”的分类标签,可以根据预设规则选取“表明目的”的分类标签作为目标应答标签。
[0108]
s144、根据至少一个所述目标应答标签对应的概率和对应的所述候选话术数据,确定目标应答话术数据。
[0109]
具体地,一个示例中,根据预设规则选取“符合逻辑”的分类标签作为目标应答标签后,可以根据多个为“符合逻辑”的分类标签对应的概率进一步从候选话术数据中确定目标应答话术数据。
[0110]
另一个示例中,根据预设规则选取“表明目的”的分类标签作为目标应答标签后,可以根据多个为“表明”的分类标签对应的概率进一步从候选话术数据中确定目标应答话术数据。
[0111]
本公开实施例中,将每一个候选话术数据和第一意图数据组合得到至少一个待识别数据,将至少一个待识别数据逐个输入话术选择模型,得到至少一个分类标签和分类标签对应的概率,根据预设规则从分类标签中确定目标应答标签,在目标应答标签中根据分类标签对应的概率从选话术数据中确定目标应答话术数据。通过确定目标应答标签和分类标签对应的概率两项参数可以获得准确的目标应答话术数据。
[0112]
根据本公开提供的会话管理方法,步骤s144具体为:
[0113]
s145、在至少一个所述目标应答标签中,将所述分类标签对应的概率最大的目标应答标签对应的所述候选话术数据确定为目标应答话术数据。
[0114]
具体地,一个示例中,选取“符合逻辑”的分类标签作为目标应答标签后,仍具有多
个“符合逻辑”的分类标签a、b和c,其对应的为“符合逻辑”的分类标签的概率依次为0.8、0.6、0.6,此时a对应的“符合逻辑”的分类标签的概率为0.8,为a、b和c中概率最大,此时将a对应的候选话术数据作为目标应答话术数据。
[0115]
另一个示例中,通过话术选择模型得到为“确认身份”的分类标签d、为“表明目的”的分类标签e和为“表明目的”的分类标签f,共三个分类标签。d对应的分类标签的概率为0.9,e对应的分类标签的概率为0.8,f对应的分类标签的概率为0.7。若根据预设规则选取“表明目的”的分类标签作为目标应答标签,即使d对应分类标签的概率比e和f对应分类标签的概率大,但由于d不属于“表明目的”的分类标签,此时便根据目标应答标签“表明目的”对e和f对应的分类标签的概率进行比较,由于e对应的分类标签的概率比f大,因此确定分类标签e对应的候选话术数据作为目标应答话术数据。
[0116]
本公开实施例中,在至少一个所述目标应答标签中,将分类标签对应的概率最大的目标应答标签对应的候选话术数据确定为目标应答话术数据,实现目标话术数据为在目标应答标签下的最优选择,得到的目标话术数据具有良好的逻辑性。
[0117]
下面对本公开实施例提供的会话管理装置进行描述,下文描述的会话管理装置与上文描述的会话管理方法可相互对应参照。
[0118]
本公开还提供了一种会话管理装置,如图6所示,包括:
[0119]
意图识别单元61,用于将获取的待识别语句输入意图识别模型,输出第一意图数据。
[0120]
第一匹配单元62,用于根据所述第一意图数据在意图流数据库中确定对应的目标意图流数据中的目标意图数据的后置意图数据。
[0121]
其中,所述意图流数据库由多个意图流数据组成,所述意图流数据由具有顺序的多个意图数据组成,所述后置意图数据为在所述意图流数据中与所述目标意图数据相邻且排序靠后的意图数据。
[0122]
第二匹配单元63,用于根据所述后置意图数据在应答话术数据库中按照预设映射关系进行匹配,得到至少一个候选话术数据。
[0123]
确定单元64,用于将所述第一意图数据和至少一个所述候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据。
[0124]
本公开实施例中,通过将待识别语句输入意图识别模型初步确定待识别语句的意图,并根据待识别语句的意图确定符合逻辑的后置意图,将后置意图和与后置意图对应的至少一个候选话术输入话术选择模型,通过话术选择模型选择符合逻辑的目标应答话术。从真实对话数据中通过意图流的方式可以包括尽可能多的节点和路径,数量级上远大于人工配置和规则总结的方式,尤其可以覆盖更多的长尾情况。应用话术选择模型用于配置节点上的目标应答话术,大概率符合对话上文的逻辑,避免了人工配置时很大程度上难以控制对话逻辑的问题,可以大大降低人工配置的工作量和周期,实现准确、快速地根据待识别语句选择符合逻辑的应答话术。
[0125]
根据本公开实施例提供会话管理装置,所述意图识别模型是通过如下步骤训练得到的,包括:
[0126]
将待识别语句样本输入预构建的初始意图识别模型,输出对话意图类别样本,其中,所述待识别语句样本具有预标注的所述对话意图类别标签;
[0127]
根据所述对话意图类别样本和所述预标注的对话意图类别标签,计算第一损失值;
[0128]
根据所述第一损失值调整所述初始意图识别模型的第一参数,更新所述初始意图识别模型;
[0129]
在所述第一损失值大于第一预设阈值的情况下,返回重新执行所述将待识别语句样本输入预构建的初始意图识别模型,输出对话意图类别样本的步骤;
[0130]
在所述第一损失值小于等于第一预设阈值的情况下,确定更新后的所述初始意图识别模型为意图识别模型。
[0131]
根据本公开实施例提供会话管理装置,第一匹配单元62,具体用于:
[0132]
根据所述第一意图数据在所述意图流数据库中匹配与之对应的目标意图数据;
[0133]
根据所述目标意图数据,确定目标意图流数据;
[0134]
将所述目标意图流数据中与所述目标意图数据相邻且排序靠后的意图数据确定为后置意图数据。
[0135]
根据本公开实施例提供会话管理装置,所述话术选择模型是通过如下步骤训练得到的,包括:
[0136]
将话术选择样本输入初始话术选择模型,输出样本分类标签和所述样本分类标签对应的概率,其中,所述话术选择样本包括意图数据样本和候选话术数据样本,所述话术选择样本具有预标注的预分类标签;
[0137]
根据所述样本分类标签、所述样本分类标签对应的概率和所述预标注的分类标签,计算第二损失值;
[0138]
根据所述第二损失值调整所述初始话术选择模型的第二参数,更新所述初始话术选择模型;
[0139]
在所述第二损失值大于第二预设阈值的情况下,返回重新执行所述将话术选择样本输入初始话术选择模型,输出样本分类标签和所述样本分类标签对应的概率的步骤;
[0140]
在所述第二损失值小于等于所述第二预设阈值的情况下,确定更新后的所述初始话术选择模型为所述话术选择模型。
[0141]
根据本公开实施例提供会话管理装置,确定单元64,具体用于:
[0142]
对于每一个所述候选话术数据,将所述第一意图数据和所述候选话术数据作为一个待识别数据,得到至少一个所述待识别数据;
[0143]
将所述至少一个待识别数据逐个输入所述话术选择模型,得到至少一个分类标签和与所述分类标签对应的概率;
[0144]
根据预设规则选取指定类别的分类标签作为目标应答标签,得到至少一个目标应答标签;
[0145]
根据至少一个所述目标应答标签对应的概率和对应的所述候选话术数据,确定目标应答话术数据。
[0146]
根据本公开实施例提供会话管理装置,确定单元64,具体用于:
[0147]
在至少一个所述目标应答标签中,将所述分类标签对应的概率最大的目标应答标签对应的所述候选话术数据确定为目标应答话术数据。
[0148]
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处
理器(processor)710、通信接口(communications interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行会话管理方法,该方法包括:将获取的待识别语句输入意图识别模型,输出第一意图数据;根据所述第一意图数据在意图流数据库中确定对应的目标意图流数据中的目标意图数据的后置意图数据,所述意图流数据库由多个意图流数据组成,所述意图流数据由具有顺序的多个意图数据组成,所述后置意图数据为在所述意图流数据中与所述对应的目标意图数据相邻且排序靠后的意图数据;根据所述后置意图数据在所述应答话术数据库中按照预设映射关系进行匹配,得到至少一个候选话术数据;将所述第一意图数据和至少一个所述候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据。
[0149]
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0150]
另一方面,本公开还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的会话管理方法,该方法包括:将获取的待识别语句输入意图识别模型,输出第一意图数据;根据所述第一意图数据在意图流数据库中确定对应的目标意图流数据中的目标意图数据的后置意图数据,所述意图流数据库由多个意图流数据组成,所述意图流数据由具有顺序的多个意图数据组成,所述后置意图数据为在所述意图流数据中与所述目标意图数据相邻且排序靠后的意图数据;根据所述后置意图数据在应答话术数据库中按照预设映射关系进行匹配,得到至少一个候选话术数据;将所述第一意图数据和至少一个所述候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据。
[0151]
又一方面,本公开还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的会话管理方法,该方法包括:将获取的待识别语句输入意图识别模型,输出第一意图数据;根据所述第一意图数据在意图流数据库中确定对应的目标意图流数据中的目标意图数据的后置意图数据,所述意图流数据库由多个意图流数据组成,所述意图流数据由具有顺序的多个意图数据组成,所述后置意图数据为在所述意图流数据中与所述目标意图数据相邻且排序靠后的意图数据;根据所述后置意图数据在应答话术数据库中按照预设映射关系进行匹配,得到至少一个候选话术数据;将所述第一意图数据和至少一个所述候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据。
[0152]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单
元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0153]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0154]
最后应说明的是:以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围。
技术特征:1.一种会话管理方法,其特征在于,包括:将获取的待识别语句输入意图识别模型,输出第一意图数据;根据所述第一意图数据在意图流数据库中确定对应的目标意图流数据中的目标意图数据的后置意图数据,所述意图流数据库由多个意图流数据组成,所述意图流数据由具有顺序的多个意图数据组成,所述后置意图数据为在所述意图流数据中与所述目标意图数据相邻且排序靠后的意图数据;根据所述后置意图数据在应答话术数据库中按照预设映射关系进行匹配,得到至少一个候选话术数据;将所述第一意图数据和至少一个所述候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据。2.根据权利要求1所述的会话管理方法,其特征在于,所述意图识别模型是通过如下步骤训练得到的,包括:将待识别语句样本输入预构建的初始意图识别模型,输出对话意图类别样本,其中,所述待识别语句样本具有预标注的所述对话意图类别标签;根据所述对话意图类别样本和所述预标注的对话意图类别标签,计算第一损失值;根据所述第一损失值调整所述初始意图识别模型的第一参数,更新所述初始意图识别模型;在所述第一损失值大于第一预设阈值的情况下,返回重新执行所述将待识别语句样本输入预构建的初始意图识别模型,输出对话意图类别样本的步骤;在所述第一损失值小于等于第一预设阈值的情况下,确定更新后的所述初始意图识别模型为意图识别模型。3.根据权利要求2所述的会话管理方法,其特征在于,所述根据所述第一意图数据在意图流数据库中确定对应的目标意图流数据中的目标意图数据的后置意图数据的步骤,包括:根据所述第一意图数据在所述意图流数据库中匹配与之对应的目标意图数据;根据所述目标意图数据,确定目标意图流数据;将所述目标意图流数据中与所述目标意图数据相邻且排序靠后的意图数据确定为后置意图数据。4.根据权利要求3所述的会话管理方法,其特征在于,所述话术选择模型是通过如下步骤训练得到的,包括:将话术选择样本输入初始话术选择模型,输出样本分类标签和所述样本分类标签对应的概率,其中,所述话术选择样本包括意图数据样本和候选话术数据样本,所述话术选择样本具有预标注的预分类标签;根据所述样本分类标签、所述样本分类标签对应的概率和所述预标注的分类标签,计算第二损失值;根据所述第二损失值调整所述初始话术选择模型的第二参数,更新所述初始话术选择模型;在所述第二损失值大于第二预设阈值的情况下,返回重新执行所述将话术选择样本输入初始话术选择模型,输出样本分类标签和所述样本分类标签对应的概率的步骤;
在所述第二损失值小于等于所述第二预设阈值的情况下,确定更新后的所述初始话术选择模型为所述话术选择模型。5.根据权利要求4所述的会话管理方法,其特征在于,所述将所述第一意图数据和至少一个所述候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据的步骤,包括:对于每一个所述候选话术数据,将所述第一意图数据和所述候选话术数据作为一个待识别数据,得到至少一个所述待识别数据;将所述至少一个待识别数据逐个输入所述话术选择模型,得到至少一个分类标签和与所述分类标签对应的概率;根据预设规则选取指定类别的分类标签作为目标应答标签,得到至少一个目标应答标签;根据至少一个所述目标应答标签对应的概率和对应的所述候选话术数据,确定目标应答话术数据。6.根据权利要求5所述的会话管理方法,其特征在于,所述根据至少一个所述目标应答标签对应的概率和对应的所述候选话术数据,确定目标应答话术数据的步骤,包括:在至少一个所述目标应答标签中,将所述分类标签对应的概率最大的目标应答标签对应的所述候选话术数据确定为目标应答话术数据。7.一种会话管理装置,其特征在于,包括:意图识别单元,用于将获取的待识别语句输入意图识别模型,输出第一意图数据;第一匹配单元,用于根据所述第一意图数据在意图流数据库中确定对应的目标意图流数据中的目标意图数据的后置意图数据,所述意图流数据库由多个意图流数据组成,所述意图流数据由具有顺序的多个意图数据组成,所述后置意图数据为在所述意图流数据中与所述目标意图数据相邻且排序靠后的意图数据;第二匹配单元,用于根据所述后置意图数据在应答话术数据库中按照预设映射关系进行匹配,得到至少一个候选话术数据;确定单元,用于将所述第一意图数据和至少一个所述候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据。8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述会话管理方法的步骤。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述会话管理方法的步骤。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述会话管理方法的步骤。
技术总结本公开提供一种会话管理方法、装置和电子设备,方法包括:将获取的待识别语句输入意图识别模型,输出第一意图数据;根据第一意图数据在意图流数据库中确定对应的目标意图流数据中的目标意图数据的后置意图数据,意图流数据库由多个意图流数据组成,意图流数据由具有顺序的多个意图数据组成,后置意图数据为在意图流数据中与目标意图数据相邻且排序靠后的意图数据;根据后置意图数据在应答话术数据库中按照预设映射关系进行匹配,得到至少一个候选话术数据;将第一意图数据和至少一个候选话术数据输入话术选择模型,根据输出结果确定目标应答话术数据。实现准确、快速地根据待识别语句选择符合逻辑的应答话术。语句选择符合逻辑的应答话术。语句选择符合逻辑的应答话术。
技术研发人员:胡晓亮 闫慧丽 倪云 季圣哲 邱志明
受保护的技术使用者:京东科技信息技术有限公司
技术研发日:2022.07.21
技术公布日:2022/11/1