本发明涉及智能对话,更具体地说,本发明涉及基于大模型及本地知识库的智能对话方法、系统及设备。
背景技术:
1、随着人工智能技术的快速发展,尤其是在自然语言处理(nlp)领域,智能对话系统已成为研究和应用的热点。这些系统旨在自动化地与用户进行有效沟通,解决用户的疑问或执行特定任务。然而,现有技术中的对话系统在处理用户的模糊输入时常常表现不足,难以准确理解用户的真实意图,尤其是在输入数据复杂或语义不明确时。
2、传统的对话系统多依赖于固定的规则或简单的关键词匹配技术,这限制了系统在面对模糊或多义性问题时的表现。尽管一些高级系统采用了机器学习方法来提高理解能力,但这些系统往往需要大量的标注数据,且在未见过的新类型问题上依旧表现不佳。此外,现有的对话系统在选择回应类型时缺乏灵活性,通常未能根据具体情境来调整其回答策略,导致用户体验受到影响。因此,急需一种能够有效处理模糊输入并智能调整回应类型的新型智能对话系统解决方案。
技术实现思路
1、为实现上述目的,本发明提供如下技术方案:
2、基于大模型及本地知识库的智能对话方法,包括以下步骤:
3、获取用户输入内容并对用户输入内容进行预处理操作,然后基于预处理操作的结果进行匹配度分析操作;
4、基于匹配度分析操作的结果判断本地知识库是否存在匹配度不足的隐患问题;
5、对于本地知识库存在匹配度不足的隐患问题对应的用户输入内容进行特征提取并进行特征分析操作,然后根据特征分析操作的结果对当前用户输入内容采用的知识回应对话类型进行推断并使用。
6、在一个优选的实施方式中,对用户输入内容进行预处理操作指的是按照预设的策略对用户输入内容进行分词处理,得到用户输入中的多个关键词组成的关键词集合。
7、在一个优选的实施方式中,匹配度分析操作指的是:
8、分别获取关键词集合中的每一个关键词并与本地知识库中的术语集合进行匹配,得到该关键词与本地知识库中的术语集合中的术语相似度最大值,然后将每一个关键词对应的相似度最大值进行汇总,得到匹配集合,然后计算匹配集合的平均值和标准差,然后将匹配集合的平均值和标准差分别与预设的标准密度范围和标准差阈值进行对比,如果匹配集合的平均值落入预设的标准密度范围内且匹配集合的标准差小于等于预设的标准差阈值,则生成正常信号,如果不满足匹配集合的平均值落入预设的标准密度范围内且匹配集合的标准差小于等于预设的标准差阈值,则生成异常信号。
9、在一个优选的实施方式中,基于匹配度分析操作的结果判断本地知识库是否存在匹配度不足的隐患问题指的是:异常信号生成时,本地知识库存在匹配度不足的隐患问题。
10、特征提取并进行特征分析操作指的是:提取用户输入内容的模糊度特征信息和领域相关性信息,基于模糊度特征信息生成模糊度指数,基于领域相关性信息生成领域相关性指数。
11、在一个优选的实施方式中,模糊度指数的获取逻辑为:
12、获取用户输入的文本并进行分词处理,然后对分词后的文本计算每个词的词频,并识别词频低于预设基准阈值的长尾词汇,接着计算长尾词汇在文本中的占比,得到词汇复杂度系数ch;
13、使用预训练的语义相似度模型,计算用户问题与多个语义解释的相似度值,然后确定与最高相似度解释对应的值并记作最高相似度s1,同时计算所有解释的相似度之和并记作总相似度s2,通过以下公式计算语义模糊度系数yy:;
14、对用户输入的句子进行句法解析生成句法树,然后识别句法结构中存在多种解释的节点并计数为c1,统计所有句法结构节点的总数为c2,然后使用公式计算句法模糊系数jf:;
15、将词汇复杂度系数ch、语义模糊度系数yy、句法模糊系数jf一同代入以下计算公式中:;表示模糊度指数,、、均为预设的权重系数,为防止除零错误而设置的常数。
16、在一个优选的实施方式中,领域相关性指数的获取逻辑为:
17、对于用户输入的关键词集合中的每一个关键词,计算其与本地知识库中术语集合的相似度,选择相似度最大值作为该关键词的最终相似度得分并记作,然后进行以下计算:
18、;为编号为i对应的关键词预设的影响系数,k为预设的指数放大系数,取值范围为一至三,n为关键词集合中的关键词总数,为领域相关性指数。
19、在一个优选的实施方式中,对当前用户输入内容采用的知识回应对话类型进行推断指的是:
20、将领域相关性指数和模糊度指数均作为输入变量,将当前用户输入内容采用的知识回应对话类型作为输出变量,对输入变量模糊化处理,将输入变量的值转换为模糊集合,对输出变量模糊化处理,将输出变量转换为模糊集合,制定模糊规则,描述不同数据种类组合下的对话回应需求,将模糊化后的输入变量通过模糊规则进行推理,得到当前用户输入内容采用的知识回应对话类型。
21、在一个优选的实施方式中,基于大模型及本地知识库的智能对话系统,用于实现基于大模型及本地知识库的智能对话方法,包括:
22、预处理模块,用于获取用户输入内容并对用户输入内容进行预处理操作;
23、匹配度分析模块,用于基于预处理操作的结果进行匹配度分析操作,并判断本地知识库是否存在匹配度不足的隐患问题;
24、特征分析模块,用于对于本地知识库存在匹配度不足的隐患问题对应的用户输入内容进行特征提取并进行特征分析操作;
25、对话类型推断模块,用于根据特征分析操作的结果对当前用户输入内容采用的知识回应对话类型进行推断并使用。
26、在一个优选的实施方式中,基于大模型及本地知识库的智能对话设备,包括存储器和处理器,存储器用于存储包括程序指令的信息,处理器用于控制程序指令的执行,程序指令被处理器加载并执行时实现基于大模型及本地知识库的智能对话方法。
27、本发明的技术效果和优点:
28、利用大模型和本地知识库,本发明可以全面分析用户输入,迅速准确地匹配到相关知识库条目或通过大模型生成的深度响应。这种自动化的数据分析和处理能力极大提高了问题解决的速度和准确度,避免了传统人工对话可能出现的误解或延迟。
29、通过自动化的智能对话系统,本发明减少了依赖于人工操作可能引入的错误和偏见,确保了提供给用户的信息和解决方案的一致性和可靠性。同时,快速且准确的响应显著提升了用户满意度,增强了用户对服务的信任。
30、结合模糊逻辑,本发明能够根据用户输入的具体情况动态调整对话策略,如从基础回答到深入解释再到引导提问,确保与用户的交互更加个性化和目标导向。这种策略的灵活性使得系统能够更好地满足不同用户的需求。
31、通过智能化的决策支持,本发明优化了人力和计算资源的使用。系统可以自动确定何时使用本地知识库中的数据何时需要调用计算密集的大模型,从而在保证服务质量的同时,降低运营成本。
1.基于大模型及本地知识库的智能对话方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于大模型及本地知识库的智能对话方法,其特征在于,对用户输入内容进行预处理操作指的是按照预设的策略对用户输入内容进行分词处理,得到用户输入中的多个关键词组成的关键词集合。
3.根据权利要求2所述的基于大模型及本地知识库的智能对话方法,其特征在于,匹配度分析操作指的是:
4.根据权利要求3所述的基于大模型及本地知识库的智能对话方法,其特征在于,基于匹配度分析操作的结果判断本地知识库是否存在匹配度不足的隐患问题指的是:异常信号生成时,本地知识库存在匹配度不足的隐患问题。
5.根据权利要求4所述的基于大模型及本地知识库的智能对话方法,其特征在于,特征提取并进行特征分析操作指的是:提取用户输入内容的模糊度特征信息和领域相关性信息,基于模糊度特征信息生成模糊度指数,基于领域相关性信息生成领域相关性指数。
6.根据权利要求5所述的基于大模型及本地知识库的智能对话方法,其特征在于,模糊度指数的获取逻辑为:
7.根据权利要求6所述的基于大模型及本地知识库的智能对话方法,其特征在于,领域相关性指数的获取逻辑为:
8.根据权利要求7所述的基于大模型及本地知识库的智能对话方法,其特征在于,对当前用户输入内容采用的知识回应对话类型进行推断指的是:
9.基于大模型及本地知识库的智能对话系统,用于实现如权利要求1-8任一项所述的基于大模型及本地知识库的智能对话方法,其特征在于,包括:
10.基于大模型及本地知识库的智能对话设备,其特征在于,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述程序指令被处理器加载并执行时实现权利要求1至8任意一项所述的方法。
