基于声场检测的翻译方法与系统与流程

专利2025-06-30  38


本发明属于智能汽车与人机交互,尤其涉及一种基于声场检测的翻译方法、系统与介质。


背景技术:

1、车载环境下的智能语音设计已支持“动口不动手”的全新交互方式,其中常见的方式就是通过某些激活词唤醒语音系统后,令其执行语音操作指令。例如,用户发出语音指令“您好,小x”即可唤醒语音系统(一般语音系统实时回复“你好”、“请说”等表示已唤醒)。其中“您好,小x”被称之为“激活词”,激活词可以由系统预设(例如“您好,小x”),也可以由用户自定义(例如,“小x,你好”、“小y你好”、“你好,小y”)。

2、上述现有技术中,车机系统在捕捉到激活词后,都是在每次设定的固定时长内(例如20秒)继续捕捉后续的语音序列。然而,实际车载环境中,每次乘坐的用户可能不同,不同的用户的谈吐习惯不同,采用固定时长并不符合实际情况;同时,上述现有技术仅支持激活车机操作指令,不支持用户的其他沟通需求,例如外籍乘客与司机之间的实时沟通。

3、此外,智能汽车通常配置多个声场传感器用于实时采集不同声场范围内的语音序列并实时分析,占用了较长时间的车机资源的同时也浪费了流量资源。而在实际车载环境中,并非任何时刻都需要启动语音交互过程,尤其是用户正常交谈的过程有可能频繁被车机语音系统打断或者干扰,也引发了乘客对于自身交谈记录被非法摄取、利用甚至泄露的担忧。


技术实现思路

1、为解决上述技术问题,本发明提出一种基于声场检测的翻译方法、系统与介质。

2、在本发明的第一个方面,提出所述翻译方法应用于车载座舱系统,所述车载座舱系统包括至少两排座椅单元,所述方法包括:

3、监测当前时刻产生的第一语音序列;

4、当所述第一语音序列来自后排座椅声场范围时,判断所述第一语音序列是否包含预设激活词;

5、如果所述第一语音序列包含预设激活词,则翻译所述第一语音序列;

6、如果所述第一语音序列不包含预设激活词,则忽略所述第一语音序列。

7、进一步的,所述方法还包括:

8、检测后排座椅的激活状态;

9、当存在两个后排座椅被激活时,检测来自后排座椅声场范围的第二语音序列;

10、当所述第二语音序列来自两个乘客时,忽略所述第二语音序列;

11、当所述第二语音序列仅来自一个乘客时,翻译所述第二语音序列。

12、所述方法还包括:

13、如果所述第一语音序列为第二语种并且包含预设激活词,则将所述第一语音序列翻译为第一语种的第二语音序列,并在前排座椅的声场范围播放所述第二语音序列;

14、其中,所述第一语种为司机所使用的语种。

15、进一步的,当监测到当前时刻产生的语音序列来自后排座椅声场范围且包含预设激活词时,在第一预设时长内采集来自后排座椅声场范围的语音作为所述第一语音序列;

16、当存在两个后排座椅被激活时,检测来自后排座椅声场范围的第二语音序列;

17、当所述第二语音序列来自两个乘客时,调整所述第一预设时长。

18、优选的,当所述第二语音序列来自两个乘客时,调整所述第一预设时长,具体包括:

19、获取所述第二语音序列包含的语音片段长度;

20、基于所述语音片段长度,调整所述第一预设时长。

21、在本发明的第二个方面,提出一种基于声场检测的翻译系统,所述翻译系统应用于车载座舱环境,所述车载座舱环境包括前排座椅和后排座椅,所述前排座椅对应第一声场范围,所述后排座椅对应第二声场范围;

22、所述翻译系统还包括:

23、声场探测单元,用于探测当前语音序列产生的声场范围;

24、座椅探测单元,用于探测座椅的激活状态;

25、声源检测单元,用于当座椅探测单元探测到两个后排座椅被激活并且声场探测单元探测到当前语音序列位于后排座椅声场范围时,检测所述当前语音序列包含的声源种类;

26、翻译单元,用于当所述声源检测单元检测到所述当前语音序列包含的声源种类为单一声源时,翻译所述当前语音序列。

27、所述翻译单元还用于当所述声源检测单元检测到所述当前语音序列包含的声源种类为非单一声源时,忽略所述当前语音序列。

28、进一步的,所述翻译系统还包括:

29、激活词探测单元,用于探测当前语音序列是否包含预设激活词;

30、当激活词探测单元探测当前语音序列包含预设激活词时,所述翻译单元翻译所述当前语音序列。

31、进一步的,所述翻译系统还包括:

32、如果所述当前语音序列为第二语种并且包含预设激活词,则将所述当前语音序列翻译为第一语种的第二语音序列,并在前排座椅的声场范围播放所述第二语音序列;

33、其中,所述第一语种为司机所使用的语种。

34、进一步的,所述翻译系统还包括:

35、当监测到后排座椅声场范围出现预设激活词时,在第一预设时长内采集来自后排座椅声场范围的语音作为所述当前语音序列;

36、当存在两个后排座椅被激活时,检测来自后排座椅声场范围的第二语音序列;

37、当所述第二语音序列来自两个乘客时,调整所述第一预设时长。

38、第一个方面所述的一种基于声场检测的翻译方法可以通过各种形式的电子设备,通过计算机程序指令自动化的实现;所述计算机程序指令可存储于不同形式的存储介质中,装载至计算机电子设备中执行。

39、因此,在本发明的第三个方面,还提供一种计算机可读存储介质,用于存储计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如第一个方面所述的一种基于声场检测的翻译方法。

40、本发明的翻译方法应用于车载座舱系统时,可以准确根据后排乘客的交谈状态自适应的进行语音序列捕捉以及翻译执行,同时不影响多员乘客的正常交流,同时,捕捉的语音序列仅在本次乘坐期间暂存,不会导致数据泄露和滥用;另外,语音采集时长还可以基于实际情况进行调整,尽可能符合不同人员的交谈习惯。因此,本发明的技术方案能够智能识别语音声场源头并辨别出当前语音交互意图,避免干扰正常的交谈环境,同时能够自适应阶段性学习。

41、本发明的进一步优点将结合说明书附图在具体实施例部分进一步详细体现。



技术特征:

1.一种基于声场检测的翻译方法,所述翻译方法应用于车载座舱系统,所述车载座舱系统包括至少两排座椅单元,其特征在于,所述方法包括:

2.如权利要求1所述的一种基于声场检测的翻译方法,其特征在于,所述方法还包括:

3.如权利要求1所述的一种基于声场检测的翻译方法,其特征在于,所述方法还包括:

4.如权利要求2所述的一种基于声场检测的翻译方法,其特征在于,所述方法还包括:

5.如权利要求4所述的一种基于声场检测的翻译方法,其特征在于,

6.一种基于声场检测的翻译系统,所述翻译系统应用于车载座舱环境,所述车载座舱环境包括前排座椅和后排座椅,所述前排座椅对应第一声场范围,所述后排座椅对应第二声场范围,其特征在于,所述翻译系统还包括:声场探测单元,用于探测当前语音序列产生的声场范围;

7.如权利要求6所述的一种基于声场检测的翻译系统,其特征在于,

8.如权利要求6所述的一种基于声场检测的翻译系统,其特征在于,所述翻译系统还包括:

9.如权利要求6所述的一种基于声场检测的翻译系统,其特征在于,所述翻译系统还包括:

10.如权利要求6所述的一种基于声场检测的翻译系统,其特征在于,所述翻译系统还包括:


技术总结
本发明提出基于声场检测的翻译方法与系统,属于智能汽车与人机交互技术领域。翻译方法应用于车载座舱系统,方法包括:监测当前时刻产生的第一语音序列;当所述第一语音序列来自后排座椅声场范围时,判断所述第一语音序列是否包含预设激活词;如果所述第一语音序列包含预设激活词,则翻译所述第一语音序列;如果所述第一语音序列不包含预设激活词,则忽略所述第一语音序列。翻译系统应用于车载座舱环境,所述车载座舱环境包括前排座椅和后排座椅,所述前排座椅对应第一声场范围,所述后排座椅对应第二声场范围。本发明的技术方案能够智能识别语音声场源头并辨别出当前语音交互意图,避免干扰正常的交谈环境,同时能够自适应阶段性学习。

技术研发人员:梅先
受保护的技术使用者:语联网(武汉)信息技术有限公司
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-15510.html

最新回复(0)