语音交互方法、计算机设备及计算机可读存储介质与流程

专利2025-12-17 23

本技术涉及语音交互，特别涉及一种语音交互方法、计算机设备及计算机可读存储介质。

背景技术：

1、在车载语音交互场景中，为保障自然语言处理模型对于用户语音的准确响应，模型会通过如车控指令、导航指令等垂类命令训练而成。然而，当用户闲聊时说出与垂类命令相关或相似的词句时，用户语音可能被车辆误识别为垂类命令，导致车辆执行用户期望外的动作，一定程度上影响用户对车辆语音交互功能的使用体验。

技术实现思路

1、本技术提供一种语音交互方法、计算机设备及计算机可读存储介质。

2、本技术实施方式提供一种语音交互方法，用于服务器，包括：

3、接收车辆转发的语音请求；

4、根据所述语音请求、第一先验信息及第一自然语言处理模型，确定所述语音请求对应的第一自然语言处理结果，其中，所述第一自然语言处理模型预先通过第一训练集训练完成，所述第一先验信息根据所述第一训练集确定；

5、向所述车辆发送所述第一自然语言处理结果，完成所述语音交互。

6、本技术实施方式提供的语音交互方法中，服务器可接收车辆转发的语音请求，并根据语音请求、第一先验信息及第一自然语言处理模型，确定语音请求对应的第一自然语言处理结果，及向车辆发送第一自然语言处理结果，使得车辆可通过第一自然语言处理结果完成语音交互。

7、如此，在本技术实施方式中，使得语音请求的自然语言处理可根据第一先验信息和第一自然语言处理模型完成，因而可在一定程度上保障语音请求的第一自然语言处理结果的准确性。以及，由于第一先验信息是根据训练第一自然语言处理模型的第一训练集确定，故语音请求的自然语言处理能够考虑到第一训练集的状态如样本分布状态，因而可进一步地提高第一自然语言处理结果的准确性，进而可在一定程度上降低用户的语音被误识别为垂类命令的情况出现，用户对于车辆语音交互功能的使用体验得以保障。

8、在本技术某些实施方式中，所述第一训练集内的样本包括多个语义单元，所述方法还包括：

9、根据所述第一训练集内的样本，确定多个预设文本单元在所述第一训练集的第一出现频次，其中，所述预设文本单元包括至少两个语义单元；

10、根据预先确定的第一频次上限与第一频次下限，对每个所述预设文本单元的第一出现频次进行平滑处理，确定平滑后频次；

11、根据所述预设文本单元的平滑后频次，及与所述预设文本单元相对应的目标文本单元的平滑后频次，确定所述预设文本单元的出现概率，其中，所述预设文本单元内的一语义单元与所述目标文本单元内一语义单元相同；

12、根据每个所述预设文本单元的所述出现概率，确定所述第一先验信息。

13、如此，在本技术实施方式中，可根据第一训练集内的样本确定多个预设文本单元在第一训练集的第一出现频次，及根据预先确定的第一频次上限与第一频次下限，对每个预设文本单元的第一出现频次进行平滑处理以确定平滑后频次，及根据预设文本单元的平滑后频次、与预设文本单元相对应的目标文本单元的平滑后频次，确定预设文本单元的出现概率，再根据每个预设文本单元的出现概率确定第一先验信息。

14、在本技术某些实施方式中，所述根据所述语音请求、第一先验信息及第一自然语言处理模型，确定所述语音请求对应的第一自然语言处理结果，包括：

15、根据所述语音请求和所述第一自然语言处理模型，预测所述语音请求对应的语义单元，确定第一预测概率信息；

16、根据所述第一预测概率信息和所述第一先验信息，确定第二预测概率信息；

17、根据所述第二预测概率信息，确定所述第一自然语言处理结果。

18、如此，在本技术实施方式中，使得服务器通过第一自然语言模型预测语音请求对应的语义单元时，可根据第一先验信息，以及第一自然语言模型针对语音请求输出的第一预测概率信息，确定第二预测概率信息，及根据第二预测概率信息确定第一自然语言处理结果，使得第一自然语言模型针对语音请求的预测概率可基于第一先验信息调整。

19、本技术实施方式提供一种语音交互方法，用于车辆，所述方法包括：

20、获取语音请求；

21、在能够接收到服务器发送的第一自然语言处理结果的情况下，根据所述第一自然语言处理结果完成所述语音交互，其中，所述第一自然语言处理结果为所述服务器根据上述的语音交互方法对所述语音请求进行处理得到。

22、如此，在本技术实施方式中，使得语音请求的自然语言处理可根据第一先验信息和第一自然语言处理模型完成，因而可在一定程度上保障语音请求的第一自然语言处理结果的准确性。以及，由于第一先验信息是根据训练第一自然语言处理模型的第一训练集确定，故语音请求的自然语言处理能够考虑到第一训练集的状态如样本分布状态，因而可进一步地提高第一自然语言处理结果的准确性，进而可在一定程度上降低用户的语音被误识别为垂类命令的情况出现，用户对于车辆语音交互功能的使用体验得以保障。

23、在本技术某些实施方式中，还包括：

24、根据所述语音请求、第二先验信息及第二自然语言处理模型，确定所述语音请求对应的第二自然语言处理结果，其中，所述第二自然语言处理模型预先通过第二训练集完成训练，所述第二先验信息根据所述第二训练集确定；

25、在未能够接收到所述第一自然语言处理结果的情况下，根据第二自然语言处理结果完成所述语音交互。

26、如此，在本技术实施方式中，使得车辆可根据语音请求、第二先验信息及第二自然语言处理模型，确定语音请求对应的第二自然语言处理结果，进而可在未能够接收到第一自然语言处理结果的情况下，根据第二自然语言处理结果完成语音交互，由此在一定程度上保障有车辆的语音交互功能的稳健运行。

27、在本技术某些实施方式中，所述第二训练集内的样本包括多个语义单元，所述方法还包括：

28、根据所述第二训练集内的样本，确定所述第二训练集中每个语义单元的第二出现频次；

29、根据预先确定的第二频次上限与第二频次下限，对所述第二训练集中每个语义单元的第二出现频次进行平滑处理，确定所述第二训练集中每个语义单元的处理后频次；

30、根据所述第二训练集中每个语义单元的处理后频次，确定每个语义单元的出现概率；

31、根据所述第二训练集中每个语义单元的出现概率，确定所述第二先验信息。

32、如此，在本技术实施方式中，可根据第二训练集内的样本，确定第二训练集中每个语义单元的第二出现频次，并通过预先确定的第二频次上限与第二频次下限，对第二训练集中每个语义单元的第二出现频次进行平滑处理，确定第二训练集中每个语义单元的处理后频次，再根据第二训练集中每个语义单元的处理后频次，确定每个语义单元的出现概率，及根据第二训练集中每个语义单元的出现概率确定第二先验信息。

33、在本技术某些实施方式中，所述根据所述语音请求、第二先验信息及第二自然语言处理模型，确定所述语音请求对应的第二自然语言处理结果，包括：

34、根据所述语音请求和所述第二自然语言处理模型，预测所述语音请求对应的语义单元，确定第三预测概率信息；

35、根据所述第三预测概率信息和所述第二先验信息，确定第四预测概率信息；

36、根据所述第四预测概率信息，确定所述第二自然语言处理结果。

37、如此，在本技术实施方式中，使得服务器通过第二自然语言模型预测语音请求对应的语义单元时，可根据第二先验信息，以及第二自然语言模型针对语音请求输出的第三预测概率信息，确定第四预测概率信息，及根据第四预测概率信息确定第二自然语言处理结果。

38、在本技术某些实施方式中，所述方法还包括：

39、根据获取到的历史语音请求，更新所述第二先验信息。

40、如此，在本技术实施方式中，使得车辆可根据获取到的历史语音请求更新第二先验信息，使得第二先验信息能够在一定程度上与历史语音请求指示的用户个人偏好形成匹配。

41、本技术实施方式提供一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现上述的语音交互方法。

42、本技术实施方式提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，实现上述的语音交互方法。

43、本技术实施方式提供的计算机设备和计算机可读存储介质，使得语音请求的自然语言处理可根据第一先验信息和第一自然语言处理模型完成，因而可在一定程度上保障语音请求的第一自然语言处理结果的准确性。以及，由于第一先验信息是根据训练第一自然语言处理模型的第一训练集确定，故语音请求的自然语言处理能够考虑到第一训练集的状态如样本分布状态，因而可进一步地提高第一自然语言处理结果的准确性，进而可在一定程度上降低用户的语音被误识别为垂类命令的情况出现，用户对于车辆语音交互功能的使用体验得以保障。

44、本技术的实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本技术的实施方式的实践了解到。

技术特征：

1.一种语音交互方法，其特征在于，用于服务器，包括：

2.根据权利要求1所述的方法，其特征在于，所述第一训练集内的样本包括多个语义单元，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述语音请求、第一先验信息及第一自然语言处理模型，确定所述语音请求对应的第一自然语言处理结果，包括：

4.一种语音交互方法，其特征在于，用于车辆，所述方法包括：

5.根据权利要求4所述的方法，其特征在于，还包括：

6.根据权利要求5所述的方法，其特征在于，所述第二训练集内的样本包括多个语义单元，所述方法还包括：

7.根据权利要求5所述的方法，其特征在于，所述根据所述语音请求、第二先验信息及第二自然语言处理模型，确定所述语音请求对应的第二自然语言处理结果，包括：

8.根据权利要求5所述的方法，其特征在于，所述方法还包括：

9.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现权利要求1-8任意一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，实现权利要求1-8任意一项所述的方法。

技术总结
本申请公开一种语音交互方法、计算机设备及计算机可读存储介质，所述方法包括：可接收车辆转发的语音请求，根据语音请求、第一先验信息及第一自然语言处理模型，确定语音请求对应的第一自然语言处理结果，及向车辆发送第一自然语言处理结果以完成语音交互。如此，本申请使得语音请求的自然语言处理可根据第一先验信息和第一自然语言处理模型完成，语音请求的自然语言处理能够考虑到第一训练集的状态如样本分布状态，因而可进一步地提高第一自然语言处理结果的准确性，进而可在一定程度上降低用户的语音被误识别为垂类命令的情况出现，用户对于车辆语音交互功能的使用体验得以保障。

技术研发人员：张辽,黄搏培,余骁捷
受保护的技术使用者：广州小鹏汽车科技有限公司
技术研发日：
技术公布日：2024/11/11

转载请注明原文地址: https://tieba.8miu.com/read-18436.html

专利

最新回复(0)