一种基于群组的问答处理、问答处理方法和装置与流程

专利2024-07-25  41



1.本技术属于电数字数据处理技术领域,尤其涉及一种基于群组的问答处理、问答处理方法和装置。


背景技术:

2.目前,用户如何存在专业问题的问询需求,往往需要专门与专业人员进行一对一问询,即使是存在专业群组的,也需要在群组中提出问题之后,等待群组中的专业人员回复,但是往往专业人员是相对比较忙碌的,回复的时效性等得不到保障,且对于群组而言,往往有很多问题是相似的,之前已经有用户在群组中提出过相似的问题,这些问答数据难以得到有效利用,导致数据资源的利用率较低,且用户新的问题得不到及时反馈,用户体验较差。
3.针对现有的群组中数据资源利用率低、用户体验较差的技术问题,目前尚未提出有效的解决方案。


技术实现要素:

4.本技术目的在于提供一种基于群组的问答处理、问答处理方法和装置,以提升数据利用率,提升用户体验。
5.本技术提供一种基于群组的问答处理、问答处理方法和装置是这样实现的:
6.一种基于群组的问答处理方法,所述方法包括:
7.获取目标用户在群组界面中输入的问题文本;
8.对所述问题文本进行关键词提取,得到第一特征集;
9.将所述目标用户输入的辅助特征,作为第二特征集;
10.根据所述第一特征集和所述第二特征集从问答库中匹配得到问答对,其中,所述问答库是基于历史问答数据生成的;
11.将匹配得到的问答对返回至所述群组界面。
12.一种基于群组的问答处理方法,所述方法包括:
13.显示群组界面;
14.接收目标用户在群组界面中输入的问题文本;
15.在所述群组界面中显示与所述问题文本关联的问答对,其中,所述问答对是从问答库中匹配得到的,所述问答库是基于历史问答数据生成的。
16.一种问答处理方法,所述方法包括:
17.获取目标用户输入的问题文本;
18.对所述问题文本进行关键词提取,得到第一特征集;
19.根据所述第一特征集从问答库中匹配得到一个或多个问答对,其中,所述问答库是历史问答数据生成的;
20.将匹配得到的一个或多个问答对返回至所述目标用户。
21.一种基于群组的问答处理装置,包括:
22.第一获取模块,用于获取目标用户在群组界面中输入的问题文本;
23.提取模块,用于对所述问题文本进行关键词提取,得到第一特征集;
24.第二获取模块,用于将所述目标用户输入的辅助特征,作为第二特征集;
25.匹配模块,用于根据所述第一特征集和所述第二特征集从问答库中匹配得到问答对,其中,所述问答库是基于历史问答数据生成的;
26.返回模块,用于将匹配得到的问答对返回至所述群组界面。
27.一种基于群组的问答处理装置,位于终端设备中,包括:
28.显示模块,用于显示群组界面;
29.接收模块,用于接收目标用户在群组界面中输入的问题文本;
30.显示模块,用于在所述群组界面中显示与所述问题文本关联的问答对,其中,所述问答对是从问答库中匹配得到的,所述问答库是基于历史问答数据生成的。
31.一种问答处理装置,包括:
32.获取模块,用于获取目标用户输入的问题文本;
33.提取模块,用于对所述问题文本进行关键词提取,得到第一特征集;
34.匹配模块,用于根据所述第一特征集从问答库中匹配得到一个或多个问答对,其中,所述问答库是历史问答数据生成的;
35.返回模块,用于将匹配得到的一个或多个问答对返回至所述目标用户。
36.一种电子设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现上述方法的步骤。
37.一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现上述方法的步骤。
38.本技术提供的问答处理方法,基于历史问答数据生成问答库,在用户存在问答需求的时候,基于用户的问题文本从问答库中匹配得到一个或问答对返回给用户,以实现基于历史问答数据的快速解答,进一步的,将这种问答方式应用在群组的问答场景中,可以解决现有的群组问答中同样问题被反复回答,问题得不到快速回复的技术问题,达到了有效提升数据利用率,提升用户体验的技术效果。且在实现的过程中,对问题文本进行关键词提取,得到第一特征集,并结合目标用户输入的辅助特征,作为第二特征集,联合从问答库中匹配得到问答对,从而可以有效提升匹配结果的准确率。
附图说明
39.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
40.图1是本技术提供的基于群组的问答处理系统一种实施例的架构图;
41.图2是本技术提供的基于群组的问答处理系统的交互示意图;
42.图3是本技术提供的用户在群聊中提问的界面示意图;
43.图4是本技术提供的基于辅助标签项的问答匹配流程图;
44.图5是本技术提供的基于群组的问答处理方法一种实施例的方法流程图;
45.图6是本技术提供的一种基于群组的问答处理方法的电子设备的硬件结构框图;
46.图7是本技术提供的基于群组的问答处理装置一种实施例的模块结构示意图。
具体实施方式
47.为了使本技术领域的人员更好地理解本技术中的技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
48.以医疗问诊场景为例,一般医疗问诊群是为了满足医患的沟通需求,患者可以问诊群的群聊中向医生提问求助,得到医生的专业回答或解决方案。提问的途径包括几种:1)直接向医生提问;2)向其他有经验的患者提问;3)搜索群问答中其它相关案例。然而,针对这几种情况下,都需要耗费时间成本,尤其在病情比较紧急,或者,经验不足的时候,例如,对于有小宝宝的家庭,如果孩子出现不舒服,是希望可以第一时间得到回复的,上述这些方式都难以在第一时间得到回复。这主要是因为:
49.1)等待医生(即,专业人士)的回复时间过长,因为医生一般工作比较忙,需要空闲时间才能回复,这样就难以避免的需要用户等待很长时间;
50.2)医生工作负担较重,但是在群聊中往往有很多重复性的问题,多次对同一问题或者近似问题进行回复,将加重医生的工作量;
51.3)对于患者而言,在提问的时候,有时候问题描述不全面,或者说明不准确,也会给问答增加工作量和负担;
52.针对以上情况,在本例中提供了一种问答处理系统,如图1所示,可以包括:用户终端101(101-1、101-2、101-3等)、服务器102、问答库103。其中,用户终端101可以是手机、电脑、平板等智能设备,用户通过用户终端101加入群组中,或者是下载应用,通过应用提出问题;服务器102,可以是云服务器、单一服务器或者是服务器集群,在获取到用户终端101的问题文本之后,可以与问答库103进行匹配,以得到一个或多个问答对,作为与该问题关联的答复内容,并推送至用户终端101,其中,对于问答库103的问答对,可以是基于历史问答数据生成。
53.其中,用户终端101可以是客户操作使用的终端设备或者软件。具体的,用户终端101可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能手表或者其它可穿戴设备等终端设备。当然,用户终端101也可以是能运行于上述终端设备中的软件。例如:医疗问诊应用、通讯应用、社群或者浏览器等应用软件。
54.如图2所示,为基于上述问答处理系统的交互示意图,用户通过用户在群组中提出问题,群聊将用户的提问传送至服务端,以向服务器发送请求,服务端将问题转换为文本数据,然后传输至算法端,算法端根据问题对应的文本数据进行自然语言处理,提取出关键特征,然后通过问答库根据关键特征进行匹配,以查询匹配得到问答对,问答库将匹配到的问答对返回至算法端,算法端将匹配到的问答对返回至服务端,服务端将匹配到的问答对返回至群聊,群聊将匹配到的问答对展示给用户。通过这种方式可以在快速准确回答用户提
问的情况下,又可以降低专业人员的回复压力,提升沟通效率。
55.对于上述问答库中的数据,可以是以问答对的方式存在的,该问答库可以是动态更新的。问答库可以是对同类型的群组中的问答数据进行整合和更新形成的,各群组在设置的时候,一般会存在群组类型的选择,例如,如果选择群组类型是“母婴问诊”,那么可以将类型为“母婴问诊”的群组中的问答数据都作为对应的问答库的数据基础,从而形成针对“母婴问诊”这个类型的群组中提问回复的判断基础。如果选择群组类型为“糖尿病”群组,那么相应的,该群组中的问答数据,将作为形成“糖尿病”类型的群组的问答库的基础。即,对于群组而言是存在群组类型的,在进行问答数据匹配的时候,可以从其对应的问答库中进行匹配,该问答库是基于同类群组中的问答数据实时更新生成的。
56.如图3所示,在正常的群聊场景中,设置“提问功能”,使得用户a在群聊中以“提问”的方式提出问题,系统识别到用户是以提问的方式输入的内容,在用户选择提问,并输入提问内容选择发送之后,可以在群聊中形成一条“提问记录”,可以在这个时候触发进行智能的问答匹配,从而可以从问答库中匹配出一个或多个问答对,返回至群组中,作为用户该提问的回复。匹配到的问答对可以以缩略的形式在群聊中显示,如果用户希望查看详细内容,可以点击以触发查看问答对中详细的内容。
57.在实际实现的时候,考虑到这种智能回复的方式,是为了减少医生或者其它专业人士回复的效率,减少他们的工作量,但是有时专业人士是有时间可以答复的,为此,针对某个问题,在智能回复之后,如果专业人士(例如:医生)也给予了回复,那么可以将该回复与对应的问题,作为一个新的问答对存储至问答库中,以实现对问答库的有效更新。
58.为此,可以为群组中的专业人士设置身份标签,例如,如果是问诊群,那么群组中的医生可以申请进行身份标签的认证,在认证通过后,可以为医生设置一个身份标签,以表明该用户是医生。这样,如果在回复群组中用户的问题的时候,识别到是医生身份的成员回复的,那么可以形成一个有效的问答对增加至问答库中,从而可以避免了不管任何成员回复都增加至问答库导致的问答库数据准确性较低,耗费数据资源过多的问题。
59.进一步的,考虑到用户在群组中提出问题的时候,有时会存在表述不充分,遗漏关键信息的情况,这样将导致智能回复的准确性变低,为此,在本例中引入了辅助特征的概念,即,结合用户输入的问题文本和辅助特征,联合进行问答数据的匹配。具体的,基于群组的问答处理方法,可以包括:获取目标用户在群组界面中输入的问题文本;对所述问题文本进行关键词提取,得到第一特征集;将所述目标用户输入的辅助特征,作为第二特征集;根据所述第一特征集和所述第二特征集从问答库中匹配得到问答对,其中,所述问答库是基于历史问答数据生成的;将匹配得到的问答对返回至所述群组界面。
60.对于上述的辅助特征,可以是系统结合用户的问题,或者群组的类型,预先设定的,例如,针对问诊的群组,识别到用户是对疾病进行的提问,那么可以如图4所示,用户在输入“宝宝三周了,黄疸还未退,怎么办”问题之后,可以设置:人群类型、伴随症状、发病时长等作为辅助标签项,用户采用输入或者是选择的方式,对这些辅助标签项给予回复,从而形成辅助特征。基于得到的辅助特征结合问题文本识别出的关键词,进行问答对匹配。在匹配得到多个问答对的情况下,可以按照相似度由高到低的顺序进行排序显示,在群组中显示之后,用户可以对感兴趣的问答对进行点击,以查看具体信息,从而得到有效的回答信息。
61.具体的,将所述目标用户输入的辅助特征,作为第二特征集,可以是将预设的辅助标签项推送至所述目标用户;接收所述目标用户对辅助标签项的选择操作,将所述目标用户选定的辅助标签作为辅助特征,存入所述第二特征集中。该预设的辅助标签项可以是根据群组类型预先设定的,也可以是根据用户输入的问题文本确定的,例如,可以根据所述第一特征集中的关键词,确定与所述问题文本关联的筛选标签项;将确定的与所述问题文本关联的筛选标签项作为预设的辅助标签项,推送至所述目标用户。
62.对于第一特征集,可以是通过对问题文本进行分词匹配得到的,例如,可以对问题文本进行分词拆分,得到多个分词词组;然后,调取预设的关键词词典;将所述多个分词词组中记录在所述关键词词典中的分词词组,作为目标词组存入所述第一特征集中。其中,该关键词词典可以是基于群组类型选定的,例如,群组为问诊类群组,那么该关键词词典就可以是医药相关的词典,从而可以更为准确识别出有助于匹配的关键词。
63.上述的问答方法,可以是应用在群组中的,考虑到对于一般的群组而言,各群组成员都是通过聊天的方式,在群里发送信息的,聊天可以采用文字、表情、语音、视频等,而不存在对“提问”的单独标识,为此,在本例中,为了实现对“提问”的单独标识,可以设置提问按钮,或者是提问切换,用户通过点击提问按钮,即,可以触发提问操作,那么用户当前输入的文本或者语音,将作为提问问题在群聊中展示。对于语音而言,相对于文本是不容易阅读的,为此,获取目标用户在群组界面中输入的问题文本,可以是接收目标用户对群组界面中预设的提问按钮的触发操作;响应于所述触发操作,将所述目标用户输入的数据作为问题数据;在所述问题数据为文本数据的情况下,将所述问题数据作为所述问题文本;在所述问题数据为语音数据的情况下,将所述问题数据转为文本,将转换得到的文本作为所述问题文本。即,可以将语音数据转化为文本,从而形成问题文本。
64.在上述场景中,针对提问的回复等待时间过长或搜索成本高的问题,提出了一种基于群组的问答处理方法,通过判断用户的提问意图,智能回复相似的内容方案,从而减少重复提问的可能性,提升回复效率,可以使得用户可以快速得到答案,有效避免用户等待时长过长,从而可以提升回复效率,减少专业人员的回复工作量。且,对于问答库的建立是基于历史数据不断更新变化的,而不是固定的回复答案,相对现有的智能ai问答中答复内容固定,本例的问答库可以使得回复内容更为灵活准确,提升用户体验。
65.图5是本技术提供的基于群组的问答处理方法一种实施例的方法流程图。虽然本技术提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本技术实施例描述及附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构连接进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至分布式处理环境)。
66.具体的,如图5所示,上述的基于群组的问答处理方法可以包括如下步骤:
67.步骤501:获取目标用户在群组界面中输入的问题文本;
68.即,用户可以在群聊中发起提问,对于用户发起的提问,可以是通过触发提问按钮,或者切换为提问模式的方式触发的。例如,可以接收目标用户对群组界面中预设的提问按钮的触发操作;响应于所述触发操作,将所述目标用户输入的数据作为问题数据;在所述
问题数据为文本数据的情况下,将所述问题数据作为所述问题文本;在所述问题数据为语音数据的情况下,将所述问题数据转为文本,将转换得到的文本作为所述问题文本。通过获取用户输入的内容,确定内容的呈现模型,即,确定是文本还是语音,如果是语音则转换为文本,从而得到问题文本。
69.步骤502:对所述问题文本进行关键词提取,得到第一特征集;
70.在实现的时候,可以对所述问题文本进行分词拆分,得到多个分词词组;调取预设的关键词词典;将所述多个分词词组中记录在所述关键词词典中的分词词组,作为目标词组存入所述第一特征集中。该关键词词典,可以是根据群组类型匹配得到的,即,可以设置多个领域的关键词词典,基于群组类型确定所需关键词词典的类型,从而进行匹配调用。
71.步骤503:将所述目标用户输入的辅助特征,作为第二特征集;
72.具体的,可以将预设的辅助标签项推送至所述目标用户;接收所述目标用户对辅助标签项的选择操作,将所述目标用户选定的辅助标签作为辅助特征,存入所述第二特征集中。将预设的辅助标签项推送至所述目标用户,可以包括:根据所述第一特征集中的关键词,确定与所述问题文本关联的筛选标签项;将确定的与所述问题文本关联的筛选标签项作为预设的辅助标签项,推送至所述目标用户。该预设的辅助标签项可以是根据群组类型预先设定的,也可以是根据用户输入的问题文本确定的,例如,可以根据所述第一特征集中的关键词,确定与所述问题文本关联的筛选标签项;将确定的与所述问题文本关联的筛选标签项作为预设的辅助标签项,推送至所述目标用户。
73.步骤504:根据所述第一特征集和所述第二特征集从问答库中匹配得到问答对,其中,所述问答库是基于历史问答数据生成的;
74.在第一特征集中和第二特征集中存在多个关键词,以这些关键词作为匹配词组,从问答库中进行匹配,从而得到多个问答对作为匹配结果,这些问答对可以按照关联度或者相似度由高到底的顺序排列,且可以选择排在topn的几个问答对作为匹配结果返回。
75.其中,问答库可以是以问答对的方式存在的,该问答库可以是动态更新的。问答库可以是对同类型的群组中的问答数据进行整合和更新形成的,各群组在设置的时候,一般会存在群组类型的选择,例如,如果选择群组类型是“母婴问诊”,那么可以将类型为“母婴问诊”的群组中的问答数据都作为对应的问答库的数据基础,从而形成针对“母婴问诊”这个类型的群组中提问回复的判断基础。如果选择群组类型为“糖尿病”群组,那么相应的,该群组中的问答数据,将作为形成“糖尿病”类型的群组的问答库的基础。即,对于群组而言是存在群组类型的,在进行问答数据匹配的时候,可以从其对应的问答库中进行匹配,该问答库是基于同类群组中的问答数据实时更新生成的。
76.步骤505:将匹配得到的问答对返回至所述群组界面。
77.在将匹配得到的问答对返回至所述群组界面之后,可以接收所述群组中的成员对所述问题文本的回复数据;确定执行回复操作的群组成员的身份类别;在身份类别为预设类别的情况下,将所述问题文本和所述回复数据作为一个问答对存储至所述问答库中。即,对问答库进行实时的更新维护,以提升智能问答的准确率。
78.上述的群组可以是医疗群组,上述的问题文本可以为问诊数据,在实际实现的时候,还可以应用在其它类型的群组中,例如,某个医生建立的答疑群,或者是老师建立的答疑群,或者是各行专家设置的答疑群等。
79.相应的,在本例中还提供了一种问答处理方法,可以包括如下步骤:
80.s1:获取目标用户输入的问题文本;
81.s2:对所述问题文本进行关键词提取,得到第一特征集;
82.s3:根据所述第一特征集从问答库中匹配得到一个或多个问答对,其中,所述问答库是历史问答数据生成的;
83.s4:将匹配得到的一个或多个问答对返回至所述目标用户。
84.其中,根据所述第一特征集从问答库中匹配得到一个或多个问答对,可以是根据第一特征集,确定目标疾病;将与所述目标疾病关联的辅助标签项推送至所述目标用户;将所述目标用户选定的辅助标签作为辅助特征,存入所述第二特征集中;根据所述第一特征集和所述第二特征集,从问答库中匹配得到一个或多个问答对。其中,辅助标签项可以是逐一推送至用户,由用户进行选择,而形成辅助特征的,在逐一推荐的过程中,可以基于用户对前一个标签项结果的选择,对后一个标签项的选择进行灵活调整。
85.相应的,在本例中还提供了一种基于群组的问答处理方法,应用于用户终端侧,可以包括如下步骤:
86.s1:显示群组界面;
87.s2:接收目标用户在群组界面中输入的问题文本;
88.s3:在所述群组界面中显示与所述问题文本关联的问答对,其中,所述问答对是从问答库中匹配得到的,所述问答库是基于历史问答数据生成的。
89.本技术上述实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在电子设备上为例,图6是本技术提供的一种基于群组的问答处理方法的电子设备的硬件结构框图。如图6所示,电子设备10可以包括一个或多个(图中仅示出一个)处理器02(处理器02可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器04、以及用于通信功能的传输模块06。本领域普通技术人员可以理解,图6所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,电子设备10还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。
90.存储器04可用于存储应用软件的软件程序以及模块,如本技术实施例中的基于群组的问答处理方法对应的程序指令/模块,处理器02通过运行存储在存储器04内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的基于群组的问答处理方法。存储器04可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器04可进一步包括相对于处理器02远程设置的存储器,这些远程存储器可以通过网络连接至电子设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
91.传输模块06用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备10的通信供应商提供的无线网络。在一个实例中,传输模块06包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输模块06可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
92.在软件层面,基于群组的问答处理装置可以如图7所示,可以包括:
93.第一获取模块701,用于获取目标用户在群组界面中输入的问题文本;
94.提取模块702,用于对所述问题文本进行关键词提取,得到第一特征集;
95.第二获取模块703,用于将所述目标用户输入的辅助特征,作为第二特征集;
96.匹配模块704,用于根据所述第一特征集和所述第二特征集从问答库中匹配得到问答对,其中,所述问答库是基于历史问答数据生成的;
97.返回模块705,用于将匹配得到的问答对返回至所述群组界面。
98.在一个实施方式中,第二获取模块503具体可以将预设的辅助标签项推送至所述目标用户;接收所述目标用户对辅助标签项的选择操作,将所述目标用户选定的辅助标签作为辅助特征,存入所述第二特征集中。
99.在一个实施方式中,将预设的辅助标签项推送至所述目标用户,可以包括:根据所述第一特征集中的关键词,确定与所述问题文本关联的筛选标签项;将确定的与所述问题文本关联的筛选标签项作为预设的辅助标签项,推送至所述目标用。
100.在一个实施方式中,提取模块702具体可以对所述问题文本进行分词拆分,得到多个分词词组;调取预设的关键词词典;将所述多个分词词组中记录在所述关键词词典中的分词词组,作为目标词组存入所述第一特征集中。
101.在一个实施方式中,基于群组的问答处理装置在将匹配得到的问答对返回至所述群组界面之后,可以接收所述群组中的成员对所述问题文本的回复数据;确定执行回复操作的群组成员的身份类别;在身份类别为预设类别的情况下,将所述问题文本和所述回复数据作为一个问答对存储至所述问答库中。
102.在一个实施方式中,上述第一获取模块701具体可以接收目标用户对群组界面中预设的提问按钮的触发操作;响应于所述触发操作,将所述目标用户输入的数据作为问题数据;在所述问题数据为文本数据的情况下,将所述问题数据作为所述问题文本;在所述问题数据为语音数据的情况下,将所述问题数据转为文本,将转换得到的文本作为所述问题文本。
103.在一个实施方式中,上述群组可以是医疗群组,上述问题文本可以是问诊数据。
104.在本例中还提供了一种基于群组的问答处理装置,位于终端设备中,可以包括:第一显示模块,用于显示群组界面;接收模块,用于接收目标用户在群组界面中输入的问题文本;第二显示模块,用于在所述群组界面中显示与所述问题文本关联的问答对,其中,所述问答对是从问答库中匹配得到的,所述问答库是基于历史问答数据生成的。
105.在本例中还提供了一种问答处理装置,位于服务器中,可以包括:获取模块,用于获取目标用户输入的问题文本;提取模块,用于对所述问题文本进行关键词提取,得到第一特征集;匹配模块,用于根据所述第一特征集从问答库中匹配得到一个或多个问答对,其中,所述问答库是历史问答数据生成的;返回模块,用于将匹配得到的一个或多个问答对返回至所述目标用户。
106.在一个实施方式中,根据所述第一特征集从问答库中匹配得到一个或多个问答对,可以包括:根据第一特征集,确定目标疾病;将与所述目标疾病关联的辅助标签项推送至所述目标用户;将所述目标用户选定的辅助标签作为辅助特征,存入所述第二特征集中;根据所述第一特征集和所述第二特征集,从问答库中匹配得到一个或多个问答对。
107.本技术的实施例还提供能够实现上述实施例中的基于群组的问答处理方法中全部步骤的一种电子设备的具体实施方式,所述电子设备具体包括如下内容:处理器
(processor)、存储器(memory)、通信接口(communications interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的基于群组的问答处理方法中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
108.步骤1:获取目标用户在群组界面中输入的问题文本;
109.步骤2:对所述问题文本进行关键词提取,得到第一特征集;
110.步骤3:将所述目标用户输入的辅助特征,作为第二特征集;
111.步骤4:根据所述第一特征集和所述第二特征集从问答库中匹配得到问答对,其中,所述问答库是基于历史问答数据生成的;
112.步骤5:将匹配得到的问答对返回至所述群组界面。
113.从上述描述可知,本技术实施例基于历史问答数据生成问答库,在用户存在问答需求的时候,基于用户的问题文本从问答库中匹配得到一个或问答对返回给用户,以实现基于历史问答数据的快速解答,进一步的,将这种问答方式应用在群组的问答场景中,可以解决现有的群组问答中同样问题被反复回答,问题得不到快速回复的技术问题,达到了有效提升数据利用率,提升用户体验的技术效果。且在实现的过程中,对问题文本进行关键词提取,得到第一特征集,并结合目标用户输入的辅助特征,作为第二特征集,联合从问答库中匹配得到问答对,从而可以有效提升匹配结果的准确率。
114.本技术的实施例还提供能够实现上述实施例中的基于群组的问答处理方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的基于群组的问答处理方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
115.步骤1:获取目标用户在群组界面中输入的问题文本;
116.步骤2:对所述问题文本进行关键词提取,得到第一特征集;
117.步骤3:将所述目标用户输入的辅助特征,作为第二特征集;
118.步骤4:根据所述第一特征集和所述第二特征集从问答库中匹配得到问答对,其中,所述问答库是基于历史问答数据生成的;
119.步骤5:将匹配得到的问答对返回至所述群组界面。
120.从上述描述可知,本技术实施例基于历史问答数据生成问答库,在用户存在问答需求的时候,基于用户的问题文本从问答库中匹配得到一个或问答对返回给用户,以实现基于历史问答数据的快速解答,进一步的,将这种问答方式应用在群组的问答场景中,可以解决现有的群组问答中同样问题被反复回答,问题得不到快速回复的技术问题,达到了有效提升数据利用率,提升用户体验的技术效果。且在实现的过程中,对问题文本进行关键词提取,得到第一特征集,并结合目标用户输入的辅助特征,作为第二特征集,联合从问答库中匹配得到问答对,从而可以有效提升匹配结果的准确率。
121.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
122.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围
内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
123.虽然本技术提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
124.上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
125.虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。
126.为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
127.本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
128.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序
指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
129.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
130.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
131.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
132.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
133.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
134.本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
135.本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
136.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料
或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
137.以上所述仅为本说明书实施例的实施例而已,并不用于限制本说明书实施例。对于本领域技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的权利要求范围之内。

技术特征:
1.一种基于群组的问答处理方法,其特征在于,所述方法包括:获取目标用户在群组界面中输入的问题文本;对所述问题文本进行关键词提取,得到第一特征集;将所述目标用户输入的辅助特征,作为第二特征集;根据所述第一特征集和所述第二特征集从问答库中匹配得到问答对,其中,所述问答库是基于历史问答数据生成的;将匹配得到的问答对返回至所述群组界面。2.根据权利要求1所述的方法,其特征在于,将所述目标用户输入的辅助特征,作为第二特征集,包括:将预设的辅助标签项推送至所述目标用户;接收所述目标用户对辅助标签项的选择操作,将所述目标用户选定的辅助标签作为辅助特征,存入所述第二特征集中。3.根据权利要求2所述的方法,其特征在于,将预设的辅助标签项推送至所述目标用户,包括:根据所述第一特征集中的关键词,确定与所述问题文本关联的筛选标签项;将确定的与所述问题文本关联的筛选标签项作为预设的辅助标签项,推送至所述目标用户。4.根据权利要求1所述的方法,其特征在于,对所述问题文本进行关键词提取,得到第一特征集,包括:对所述问题文本进行分词拆分,得到多个分词词组;调取预设的关键词词典;将所述多个分词词组中记录在所述关键词词典中的分词词组,作为目标词组存入所述第一特征集中。5.根据权利要求1所述的方法,其特征在于,在将匹配得到的问答对返回至所述群组界面之后,还包括:接收所述群组中的成员对所述问题文本的回复数据;确定执行回复操作的群组成员的身份类别;在身份类别为预设类别的情况下,将所述问题文本和所述回复数据作为一个问答对存储至所述问答库中。6.根据权利要求1所述的方法,其特征在于,获取目标用户在群组界面中输入的问题文本,包括:接收目标用户对群组界面中预设的提问按钮的触发操作;响应于所述触发操作,将所述目标用户输入的数据作为问题数据;在所述问题数据为文本数据的情况下,将所述问题数据作为所述问题文本;在所述问题数据为语音数据的情况下,将所述问题数据转为文本,将转换得到的文本作为所述问题文本。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述群组为医疗群组,所述问题文本为问诊数据。8.一种基于群组的问答处理方法,其特征在于,所述方法包括:
显示群组界面;接收目标用户在群组界面中输入的问题文本;在所述群组界面中显示与所述问题文本关联的问答对,其中,所述问答对是从问答库中匹配得到的,所述问答库是基于历史问答数据生成的。9.一种问答处理方法,其特征在于,所述方法包括:获取目标用户输入的问题文本;对所述问题文本进行关键词提取,得到第一特征集;根据所述第一特征集从问答库中匹配得到一个或多个问答对,其中,所述问答库是历史问答数据生成的;将匹配得到的一个或多个问答对返回至所述目标用户。10.根据权利要求9所述的方法,其特征在于,根据所述第一特征集从问答库中匹配得到一个或多个问答对,包括:根据第一特征集,确定目标疾病;将与所述目标疾病关联的辅助标签项推送至所述目标用户;将所述目标用户选定的辅助标签作为辅助特征,存入第二特征集中;根据所述第一特征集和所述第二特征集,从问答库中匹配得到一个或多个问答对。11.一种基于群组的问答处理装置,其特征在于,包括:第一获取模块,用于获取目标用户在群组界面中输入的问题文本;提取模块,用于对所述问题文本进行关键词提取,得到第一特征集;第二获取模块,用于将所述目标用户输入的辅助特征,作为第二特征集;匹配模块,用于根据所述第一特征集和所述第二特征集从问答库中匹配得到问答对,其中,所述问答库是基于历史问答数据生成的;返回模块,用于将匹配得到的问答对返回至所述群组界面。12.一种电子设备,包括处理器以及用于存储处理器可执行指令的存储器,其特征在于,所述处理器执行所述指令时实现权利要求1至7中任一项所述方法的步骤。13.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至7中任一项所述方法的步骤。

技术总结
本申请提供了一种基于群组的问答处理、问答处理方法和装置,其中,该方法包括:获取目标用户在群组界面中输入的问题文本;对所述问题文本进行关键词提取,得到第一特征集;将所述目标用户输入的辅助特征,作为第二特征集;根据所述第一特征集和所述第二特征集从问答库中匹配得到问答对,其中,所述问答库是基于历史问答数据生成的;将匹配得到的问答对返回至所述群组界面。通过上述方案达到了有效提升问答效率,提升数据利用率以及用户体验的技术效果。果。果。


技术研发人员:李彦林 王艳清
受保护的技术使用者:阿里健康科技(杭州)有限公司
技术研发日:2022.07.18
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-8960.html

最新回复(0)