对话状态的管理方法、系统、电子设备和存储介质与流程

专利2023-07-18  113



1.本发明涉及计算机技术领域,特别是涉及一种对话状态的管理方法、系统、电子设备和计算机可读存储介质。


背景技术:

2.用户主动进行的交互,用户有明确的对话任务,如买机票、订酒店等,用户通过对话完成其任务,此类对话称为任务型对话。任务型对话都有明确的任务目标,以及完成任务所需的必要信息,诸如买机票需要订票人信息、出发时间、出发地、目的地等,一个任务型对话就需要识别用户的意图,同时收集意图相关的有用信息,从而完成用户的指令。任务型对话中用户提出的任务所需要用户提供的有效信息即对话状态。
3.现有的多轮任务型对话方案更多的关注的是整体流程的设计。其中,对话状态的管理部分,一种是完全基于规则进行抽取和修改,另一种则是使用设计复杂的模型进行实现。基于规则的方式在相对有限的简单任务上上手快,使用简便,但很难扩展到复杂场景,不同任务的扩展性差。基于复杂模型的方式可以取得不错的管理效果,但训练复杂模型需要大量的标注数据,且数据标注方式繁琐,不同项目的迁移性也存在较多问题。


技术实现要素:

4.鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种对话状态的管理方法、系统、电子设备和计算机可读存储介质。
5.为了解决上述问题,根据本发明实施例的第一方面,公开了一种对话状态的管理方法,所述方法包括:获取对话上下文信息,并根据预设的对话状态的类型获取与所述对话上下文信息对应的分类型状态的类别信息和提取型状态的实体信息;从所述对话上下文信息中提取得到所述提取型状态的对话状态提取结果;根据所述类别信息和所述实体信息提取得到各自的状态向量;将所述状态向量转化为单值向量;根据所述单值向量和预设的向量标签确定所述分类型状态的对话状态预测结果和状态删改预测结果。
6.可选地,所述方法还包括:获取历史对话状态;对所述历史对话状态的嵌入式向量进行池化处理得到所述历史对话状态的特征向量;所述根据所述类别信息和所述实体信息提取得到各自的状态向量,包括:分别对所述类别信息的嵌入式向量和所述实体信息的嵌入式向量进行池化处理得到所述类别信息和所述实体信息各自的特征向量;将所述历史对话状态的特征向量分别与所述类别信息和所述实体信息各自的特征向量进行合并得到所述类别信息和所述实体信息各自的状态向量。
7.可选地,所述向量标签包含第一标签和第二标签;所述根据所述单值向量和预设的向量标签确定所述分类型状态的对话状态预测结果和状态删改预测结果,包括:若所述单值向量与所述第一标签相对应,则根据所述第一标签确定与所述单值向量对应的所述对话状态预测结果;若所述单值向量与所述第二标签相对应,则根据所述第二标签确定与所述单值向量对应的所述状态删改预测结果。
8.可选地,所述若所述单值向量与所述第一标签相对应,则根据所述第一标签确定与所述单值向量对应的所述对话状态预测结果,包括:若所述单值向量与所述第一标签相对应,则将所述对话状态预测结果确定为,提取与所述单值向量对应的所述分类型状态。
9.可选地,所述若所述单值向量与所述第二标签相对应,则根据所述第二标签确定与所述单值向量对应的所述状态删改预测结果,包括:若所述单值向量与所述第二标签相对应,则将所述状态删改预测结果确定为,删除与所述单值向量对应的所述分类型状态。
10.可选地,所述向量标签还包含第三标签;所述方法还包括:若所述单值向量与所述第三标签相对应,则根据所述第三标签确定与所述单值向量对应的分类型状态判断结果。
11.可选地,所述若所述单值向量与所述第三标签相对应,则根据所述第三标签确定与所述单值向量对应的分类型状态判断结果,包括:若所述单值向量与所述第三标签相对应,则将所述分类型状态判断结果确定为,与所述单值向量对应的所述上下文信息与所述分类型状态不相关。
12.根据本发明实施例的第二方面,还公开了一种对话状态的管理系统,所述系统包括:信息输入模块,用于获取对话上下文信息,并根据预设的对话状态的类型获取与所述对话上下文信息对应的分类型状态的类别信息和提取型状态的实体信息;结果提取模块,用于从所述对话上下文信息中提取得到所述提取型状态的对话状态提取结果;向量提取模块,用于根据所述类别信息和所述实体信息提取得到各自的状态向量;向量转化模块,用于将所述状态向量转化为单值向量;结果确定模块,用于根据所述单值向量和预设的向量标签确定所述分类型状态的对话状态预测结果和状态删改预测结果。
13.可选地,所述系统还包括:历史状态获取模块,用于获取历史对话状态;历史状态池化处理模块,用于对所述历史对话状态的嵌入式向量进行池化处理得到所述历史对话状态的特征向量;所述向量提取模块,包括:池化处理模块,用于分别对所述类别信息的嵌入式向量和所述实体信息的嵌入式向量进行池化处理得到所述类别信息和所述实体信息各自的特征向量;特征向量合并模块,用于将所述历史对话状态的特征向量分别与所述类别信息和所述实体信息各自的特征向量进行合并得到所述类别信息和所述实体信息各自的状态向量。
14.可选地,所述向量标签包含第一标签和第二标签;所述结果确定模块,包括:第一结果确定模块,用于若所述单值向量与所述第一标签相对应,则根据所述第一标签确定与所述单值向量对应的所述对话状态预测结果;第二结果确定模块,用于若所述单值向量与所述第二标签相对应,则根据所述第二标签确定与所述单值向量对应的所述状态删改预测结果。
15.可选地,所述第一结果确定模块,用于若所述单值向量与所述第一标签相对应,则将所述对话状态预测结果确定为,提取与所述单值向量对应的所述分类型状态。
16.可选地,所述第二结果确定模块,用于若所述单值向量与所述第二标签相对应,则将所述状态删改预测结果确定为,删除与所述单值向量对应的所述分类型状态。
17.可选地,所述向量标签还包含第三标签;所述结果确定模块,还包括:第三结果确定模块,用于若所述单值向量与所述第三标签相对应,则根据所述第三标签确定与所述单值向量对应的分类型状态判断结果。
18.可选地,所述第三结果确定模块,用于若所述单值向量与所述第三标签相对应,则
将所述分类型状态判断结果确定为,与所述单值向量对应的所述上下文信息与所述分类型状态不相关。
19.根据本发明实施例的第三方面,还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面所述的一种对话状态的管理方法。
20.根据本发明实施例的第四方面,还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的一种对话状态的管理方法。
21.与现有技术相比,本发明实施例提供的技术方案具有如下优点:
22.本发明实施例提供的一种对话状态的管理方案,获取对话上下文信息,并根据预设的对话状态的类型获取与对话上下文信息对应的分类型状态的类别信息和提取型状态的实体信息。将对话上下文信息、类别信息和实体信息作为对话状态管理模型的输入项。利用对话状态管理模型从对话上下文信息中直接提取得到提取型状态的对话状态提取结果。利用对话状态管理模型根据类别信息和实体信息提取得到各自的状态向量,将状态向量转化为单值向量,最终根据单值向量和预设的向量标签确定分类型状态的对话状态预测结果和状态删改预测结果。
23.本发明实施例针对不同的对话状态的类型,具体可以包含分类型状态和提取型状态采用统一的处理方式,避免了传统的对话状态管理方案针对不同的对话状态的类型需要采用不同的神经网络模型,简化了不同的神经网络模型的训练过程。而且,本发明实施例不仅可以提取对话状态预测结果,还可以输出状态删改预测结果,扩展了对话状态的管理功能。
附图说明
24.图1是本发明实施例的一种对话状态的管理方法的步骤流程图;
25.图2是本发明实施例的神经网络模型的结构示意图;
26.图3是本发明实施例的一种对话状态的管理系统的结构框图;
27.图4是本发明实施例的一种电子设备的结构示意图。
具体实施方式
28.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
29.参照图1,示出了本发明实施例的一种对话状态的管理方法的步骤流程图。该对话状态的管理方法可以应用于终端或者服务器。该对话状态的管理方法具体可以包括如下步骤:
30.步骤101,获取对话上下文信息,并根据预设的对话状态的类型获取与对话上下文信息对应的分类型状态的类别信息和提取型状态的实体信息。
31.在本发明的实施例中,预设的对话状态的类型可以包含但不限于:分类型状态和提取型状态。其中,分类型状态可以进一步划分为是否类的二分类状态(如酒店设施-有无健身房、餐饮设施-有无车位等)、多分类状态(如酒店类型-豪华型、舒适型、经济型等)。提取型状态可以理解为提取型的非限定值状态(如酒店位置、出发时间等)。上述提取型状态
可以称为非限定值状态,分类型状态可以称为限定值状态。
32.在本发明的实施例中,可以基于预先训练完毕的神经网络模型对对话状态进行管理。神经网络模型的输入项可以包含对话上下文信息、分类型状态的类别信息和实体信息等。
33.步骤102,从对话上下文信息中提取得到提取型状态的对话状态提取结果。
34.在本发明的实施例中,针对提取型状态,可以利用神经网络模型直接从对话上下文信息中结合语义信息提取得到对话状态提取结果。
35.步骤103,根据类别信息和实体信息提取得到各自的状态向量。
36.在本发明的实施例中,针对分类型状态,可以通过步骤103至步骤105提取得到对话状态预测结果。
37.在实际应用中,可以利用神经网络模型的编码层分别提取类别信息和实体信息各自的状态向量。
38.步骤104,将状态向量转化为单值向量。
39.在本发明的实施例中,利用神经网络模型的池化层和转移矩阵可以将状态向量转化为单值向量。
40.步骤105,根据单值向量和预设的向量标签确定分类型状态的对话状态预测结果和状态删改预测结果。
41.在本发明的实施例中,预先设定多个向量标签,每个向量标点可以表示不同的涵义。例如,设定三个向量标签,分别为0、-1和1。其中,向量标签1表示需要提取出对话状态,向量标签-1表示需要去除对话状态,向量标签0表示对话状态不相关。在实际应用中,可以根据单值向量与向量标签之间的对应关系,确定对话状态预测结果和状态删改预测结果。
42.本发明实施例提供的一种对话状态的管理方案,获取对话上下文信息,并根据预设的对话状态的类型获取与对话上下文信息对应的分类型状态的类别信息和提取型状态的实体信息。将对话上下文信息、类别信息和实体信息作为对话状态管理模型的输入项。利用对话状态管理模型从对话上下文信息中直接提取得到提取型状态的对话状态提取结果。利用对话状态管理模型根据类别信息和实体信息提取得到各自的状态向量,将状态向量转化为单值向量,最终根据单值向量和预设的向量标签确定分类型状态的对话状态预测结果和状态删改预测结果。
43.本发明实施例针对不同的对话状态的类型,具体可以包含分类型状态和提取型状态采用统一的处理方式,避免了传统的对话状态管理方案针对不同的对话状态的类型需要采用不同的神经网络模型,简化了不同的神经网络模型的训练过程。而且,本发明实施例不仅可以提取对话状态预测结果,还可以输出状态删改预测结果,扩展了对话状态的管理功能。
44.在本发明的一种优选实施例中,参照图2,示出了本发明实施例的神经网络模型的结构示意图。在图2中,神经网络模型可以包含输入层、编码层、池化层、转化层和输出层。对话上下文信息(content)、分类型状态的类别信息和提取型状态的实体信息均作为神经网络模型的输入层的输入项。在神经网络模型的训练过程中,对话状态也作为输入层的输入项输入至神经网络模型中。其中,分类型状态和被去除的状态赋值为零。本发明实施例对神经网络模型的输入项进行改进,无论是针对提取型状态还是分类型状态,均通过一个样本
数据标注任务完成,使得神经网络模型可以抽取各种类型的对话状态,而且还可以对对话状态进行删改处理,从而从输出层输出提取型状态的对话状态提取结果、分类型状态的对话状态预测结果和状态删改预测结果。
45.在本发明的一种优选实施例中,针对分类型状态,可以结合神经网络模型的上一轮判断结果,即结合历史对话状态,将历史对话状态也作为输入项,并对历史对话状态的嵌入式向量进行池化处理得到历史对话状态的特征向量。在根据类别信息和实体信息提取得到各自的状态向量时,可以分别对类别信息的嵌入式向量和实体信息的嵌入式向量进行池化处理得到类别信息和实体信息各自的特征向量,将历史对话状态的特征向量分别与类别信息和实体信息各自的特征向量进行合并得到类别信息和实体信息各自的状态向量。
46.在实际应用中,可以历史对话状态、类别信息和实体信息均经过编码层,从编码层输出历史对话状态、类别信息和实体信息各自的嵌入式向量。历史对话状态、类别信息和实体信息各自的嵌入式向量再输入至池化层,从池化层输出历史对话状态、类别信息和实体信息各自的特征向量,然后,将历史对话状态中分类型状态的特征向量与类别信息的特征向量进行合并得到类别信息的状态向量,将历史对话状态中提取型状态的特征向量与实体信息的特征向量进行合并得到实体信息的状态向量。
47.在本发明的一种优选实施例中,向量标签可以包含第一标签、第二标签和第三标签。在根据单值向量和预设的向量标签确定分类型状态的对话状态预测结果和状态删改预测结果时,可以判断单值向量与向量标签中的哪个向量标签相对应,若单值向量与第一标签相对应,则根据第一标签确定与单值向量对应的对话状态预测结果。此时,第一标签可以为1,表示需要提取出对话状态。具体可以将对话状态预测结果确定为,提取与单值向量对应的分类型状态的对话状态。例如,某对话状态对应的单值向量为1,则该对话状态的对话状态预测结果为,提取该对话状态。若单值向量与第二标签相对应,则根据第二标签确定与单值向量对应的状态删改预测结果。此时,第二标签可以为-1,表示需要去除对话状态。具体可以将状态删改预测结果确定为,删除与单值向量对应的分类型状态。例如,某对话状态对应的单值向量为-1,则该对话状态的状态删改预测结果为,删除该对话状态。若单值向量与第三标签相对应,则根据第三标签确定与单值向量对应的分类型状态判断结果。此时,第三标签可以为0,表示与分类型状态不相关。具体可以将分类型状态判断结果确定为,与单值向量对应的上下文信息与分类型状态不相关。例如,某对话状态对应的单值向量为0,则该对话状态的分类型状态判断结果为,与分类型状态不相关。
48.本发明实施例通过获取对话状态对应的单值向量,并设定特殊的向量标签,进而根据单值向量与向量标签之间的对应关系,选择提取对话状态还是删除对话状态,解决了传统的对话状态管理方案只能提取对话状态,无法删除对话状态的问题。
49.另外,采用将对话状态的类别信息直接作为输入项进行序列标注的方式,还有一个优势是泛化性。类似机器阅读理解,即使用户输入的对话状态的类别信息没有专门训练过,但由于神经网络模型具有语义解析能力,只要新的类别信息和已训练的类别信息存在语义相关性,神经网络模型也有一定的zero-shot的抽取能力。另外,本发明实施例的泛化性还体现在了对于对话状态删改的判断上,由于通常人们的表述上,当表达删除对话状态时,如“我不吃粤菜了”和“不住豪华型酒店了”,虽然用户表达的对话状态不相同,分别为菜系和酒店级别,但都是表达的对于对话状态的删除意图,所以是存在语义相关性的,因此,
无需每增加一个对话状态的类别信息,都准备大量的相关训练数据,大大降低了实际项目的神经完了过模型迁移易用性和泛化能力。
50.传统的对话状态管理方案在处理非限定状态、是否类状态、多类别状态这三类对话状态时,分别使用序列标注、二分类模型、多分类模型三种处理手段,没有统一的处理方式,增加了模型的复杂度。本发明实施例利用一种神经网络模型即可处理多种对话状态,简化了处理方式。
51.本发明实施例通过设定特殊的向量标签,利用其中表示删除对话的向量标签与单值向量进行对比,实现了对话状态的删除功能。
52.传统的对话状态管理方案往往忽略了模型的泛化性能,每一种数据标签都缺乏泛化性和迁移性,往往任务稍有调整就无法使用,本发明实施例的删改标签以及分类标签不是针对对话状态本身的标签,而是简单的0、-1、1的三种向量标签,利用模型显式的对话上下文信息和类别信息作为输入去进行判断,增加了模型的泛化性,即使标签变化也有一定的泛化性。
53.传统的对话状态管理方案往往仅利用当前对轮周期的对话上下文信息进行对话状态的提取,或仅在对话状态层面进行继承历史对话状态,没有将输入和历史对话状态进行结合,没有有效的将历史对话状态和当前对话状态进行联合处理。本发明实施例在模型输入时,就将历史对话状态进行编码融合,使模型具备了结合历史对话状态进行编码的能力,提升模型效果。
54.需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
55.参照图3,示出了本发明实施例的一种对话状态的管理系统的结构框图,该对话状态的管理系统可以应用于终端或者服务器,该对话状态的管理系统具体可以包括如下模块:
56.信息输入模块31,用于获取对话上下文信息,并根据预设的对话状态的类型获取与所述对话上下文信息对应的分类型状态的类别信息和提取型状态的实体信息;
57.结果提取模块32,用于从所述对话上下文信息中提取得到所述提取型状态的对话状态提取结果;
58.向量提取模块33,用于根据所述类别信息和所述实体信息提取得到各自的状态向量;
59.向量转化模块34,用于将所述状态向量转化为单值向量;
60.结果确定模块35,用于根据所述单值向量和预设的向量标签确定所述分类型状态的对话状态预测结果和状态删改预测结果。
61.在本发明的一种优选实施例中,所述系统还包括:
62.历史状态获取模块,用于获取历史对话状态;
63.历史状态池化处理模块,用于对所述历史对话状态的嵌入式向量进行池化处理得到所述历史对话状态的特征向量;
64.所述向量提取模块33,包括:
65.池化处理模块,用于分别对所述类别信息的嵌入式向量和所述实体信息的嵌入式向量进行池化处理得到所述类别信息和所述实体信息各自的特征向量;
66.特征向量合并模块,用于将所述历史对话状态的特征向量分别与所述类别信息和所述实体信息各自的特征向量进行合并得到所述类别信息和所述实体信息各自的状态向量。
67.在本发明的一种优选实施例中,所述向量标签包含第一标签和第二标签;
68.所述结果确定模块35,包括:
69.第一结果确定模块,用于若所述单值向量与所述第一标签相对应,则根据所述第一标签确定与所述单值向量对应的所述对话状态预测结果;
70.第二结果确定模块,用于若所述单值向量与所述第二标签相对应,则根据所述第二标签确定与所述单值向量对应的所述状态删改预测结果。
71.在本发明的一种优选实施例中,所述第一结果确定模块,用于若所述单值向量与所述第一标签相对应,则将所述对话状态预测结果确定为,提取与所述单值向量对应的所述分类型状态。
72.在本发明的一种优选实施例中,所述第二结果确定模块,用于若所述单值向量与所述第二标签相对应,则将所述状态删改预测结果确定为,删除与所述单值向量对应的所述分类型状态。
73.在本发明的一种优选实施例中,所述向量标签还包含第三标签;所述结果确定模块35,还包括:
74.第三结果确定模块,用于若所述单值向量与所述第三标签相对应,则根据所述第三标签确定与所述单值向量对应的分类型状态判断结果。
75.在本发明的一种优选实施例中,所述第三结果确定模块,用于若所述单值向量与所述第三标签相对应,则将所述分类型状态判断结果确定为,与所述单值向量对应的所述上下文信息与所述分类型状态不相关。
76.本发明实施例还提供了一种电子设备,参见图4,包括:处理器401、存储器402以及存储在所述存储器402上并可在所述处理器401上运行的计算机程序4021,所述处理器401执行所述程序4021时实现前述实施例的对话状态的管理方法。
77.本发明实施例还提供了一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述实施例的对话状态的管理方法。
78.对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
79.需要说明的是,本发明实施例中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
80.本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
81.本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、系统、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和
硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
82.本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
83.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
84.这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
85.尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
86.最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
87.以上对本发明所提供的一种对话状态的管理方法和系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:
1.一种对话状态的管理方法,其特征在于,所述方法包括:获取对话上下文信息,并根据预设的对话状态的类型获取与所述对话上下文信息对应的分类型状态的类别信息和提取型状态的实体信息;从所述对话上下文信息中提取得到所述提取型状态的对话状态提取结果;根据所述类别信息和所述实体信息提取得到各自的状态向量;将所述状态向量转化为单值向量;根据所述单值向量和预设的向量标签确定所述分类型状态的对话状态预测结果和状态删改预测结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取历史对话状态;对所述历史对话状态的嵌入式向量进行池化处理得到所述历史对话状态的特征向量;所述根据所述类别信息和所述实体信息提取得到各自的状态向量,包括:分别对所述类别信息的嵌入式向量和所述实体信息的嵌入式向量进行池化处理得到所述类别信息和所述实体信息各自的特征向量;将所述历史对话状态的特征向量分别与所述类别信息和所述实体信息各自的特征向量进行合并得到所述类别信息和所述实体信息各自的状态向量。3.根据权利要求1所述的方法,其特征在于,所述向量标签包含第一标签和第二标签;所述根据所述单值向量和预设的向量标签确定所述分类型状态的对话状态预测结果和状态删改预测结果,包括:若所述单值向量与所述第一标签相对应,则根据所述第一标签确定与所述单值向量对应的所述对话状态预测结果;若所述单值向量与所述第二标签相对应,则根据所述第二标签确定与所述单值向量对应的所述状态删改预测结果。4.根据权利要求3所述的方法,其特征在于,所述若所述单值向量与所述第一标签相对应,则根据所述第一标签确定与所述单值向量对应的所述对话状态预测结果,包括:若所述单值向量与所述第一标签相对应,则将所述对话状态预测结果确定为,提取与所述单值向量对应的所述分类型状态。5.根据权利要求3所述的方法,其特征在于,所述若所述单值向量与所述第二标签相对应,则根据所述第二标签确定与所述单值向量对应的所述状态删改预测结果,包括:若所述单值向量与所述第二标签相对应,则将所述状态删改预测结果确定为,删除与所述单值向量对应的所述分类型状态。6.根据权利要求3所述的方法,其特征在于,所述向量标签还包含第三标签;所述方法还包括:若所述单值向量与所述第三标签相对应,则根据所述第三标签确定与所述单值向量对应的分类型状态判断结果。7.根据权利要求6所述的方法,其特征在于,所述若所述单值向量与所述第三标签相对应,则根据所述第三标签确定与所述单值向量对应的分类型状态判断结果,包括:若所述单值向量与所述第三标签相对应,则将所述分类型状态判断结果确定为,与所述单值向量对应的所述上下文信息与所述分类型状态不相关。
8.一种对话状态的管理系统,其特征在于,所述系统包括:信息输入模块,用于获取对话上下文信息,并根据预设的对话状态的类型获取与所述对话上下文信息对应的分类型状态的类别信息和提取型状态的实体信息;结果提取模块,用于从所述对话上下文信息中提取得到所述提取型状态的对话状态提取结果;向量提取模块,用于根据所述类别信息和所述实体信息提取得到各自的状态向量;向量转化模块,用于将所述状态向量转化为单值向量;结果确定模块,用于根据所述单值向量和预设的向量标签确定所述分类型状态的对话状态预测结果和状态删改预测结果。9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任意一项所述的对话状态的管理方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7中任意一项所述的对话状态的管理方法。

技术总结
本发明实施例提供了一种对话状态的管理方法和系统,其中,所述方法包括:获取对话上下文信息,并根据对话状态的类型获取分类型状态的类别信息和提取型状态的实体信息;从对话上下文信息中提取得到提取型状态的对话状态提取结果;根据类别信息和实体信息提取得到各自的状态向量;将状态向量转化为单值向量;根据单值向量和向量标签确定分类型状态的对话状态预测结果和状态删改预测结果。本发明实施例针对不同的对话状态的类型采用统一的处理方式,避免了采用不同的神经网络模型,简化了不同的神经网络模型的训练过程。不仅可以提取对话状态预测结果,还可以输出状态删改预测结果,扩展了对话状态的管理功能。扩展了对话状态的管理功能。扩展了对话状态的管理功能。


技术研发人员:邢启洲 李健 陈明 武卫东
受保护的技术使用者:北京捷通华声科技股份有限公司
技术研发日:2022.06.24
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-3986.html

最新回复(0)