语音降噪方法、装置、电子设备、存储介质及程序产品

专利2026-01-03  15


本公开涉及语音处理,尤其涉及一种语音降噪方法、装置、电子设备、存储介质及程序产品。


背景技术:

1、本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

2、传统的语音增强技术主要依赖基于统计特性的传统数字信号处理方法来进行语音降噪,基于统计特性的传统数字信号处理方法通过分析和处理音频信号的统计特性来抑制噪声,从而提高语音的质量和可理解性。

3、然而,基于统计特性的传统数字信号处理方法在新旧环境中表现不稳定,难以适应复杂多变的噪声环境。一旦过多估计噪音量,就会造成语音失真。


技术实现思路

1、有鉴于此,本公开的目的在于提出一种语音降噪方法、装置、电子设备、存储介质及程序产品,至少在一定程度上解决相关技术中的技术问题之一。

2、基于上述目的,本公开示例性实施例第一方面提供了一种语音降噪方法,应用于服务器,所述方法包括:

3、确定含噪语音数据,基于所述含噪语音数据,得到频谱梅尔滤波器系数;

4、对所述频谱梅尔滤波器系数特征进行提取,得到颗粒度的深度滤波器系数;

5、确定所述含噪语音数据的含噪语音频谱信息,基于所述含噪语音频谱信息和所述颗粒度的深度滤波器系数,得到降噪语音数据。

6、基于同一发明构思,本公开示例性实施例第二方面提供了一种语音降噪装置,包括:

7、频谱系数确定模块,被配置为确定含噪语音数据,基于所述含噪语音数据,得到频谱梅尔滤波器系数;

8、颗粒度系数确定模块,被配置为对所述频谱梅尔滤波器系数特征进行提取,得到颗粒度的深度滤波器系数;

9、降噪语音确定模块,被配置为确定所述含噪语音数据的含噪语音频谱信息,基于所述含噪语音频谱信息和所述颗粒度的深度滤波器系数,得到降噪语音数据。

10、基于同一发明构思,本公开示例性实施例第三方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的方法。

11、基于同一发明构思,本公开示例性实施例第四方面提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行如第一方面所述的方法。

12、基于同一发明构思,本公开示例性实施例第五方面提供了一种计算机程序产品,包括计算机程序指令,当所述计算机程序指令在计算机上运行时,使得计算机执行如第一方面所述的方法。

13、从上面所述可以看出,本公开实施例提供的,一种语音降噪方法、装置、电子设备、存储介质及程序产品,该方法包括:确定含噪语音数据,基于所述含噪语音数据,得到频谱梅尔滤波器系数,对所述频谱梅尔滤波器系数特征进行提取,得到颗粒度的深度滤波器系数,确定所述含噪语音数据的含噪语音频谱信息,基于所述含噪语音频谱信息和所述颗粒度的深度滤波器系数,得到降噪语音数据。本公开通过卷积网络提取语音的嵌入特征信息,用循环网络提取语音的时序特征信息以实现语音降噪,提高语音听觉上的感知质量与可懂度。



技术特征:

1.一种语音降噪方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述频谱梅尔滤波器系数包括:低频带频谱梅尔滤波器系数和全频带频谱梅尔滤波器系数;

3.根据权利要求2所述的方法,其特征在于,所述基于所述细粒度的深度滤波器系数和所述粗粒度的梅尔滤波器系数,得到所述颗粒度的深度滤波器系数,包括:

4.根据权利要求1所述的方法,其特征在于,所述确定所述含噪语音数据的含噪语音频谱信息,基于所述含噪语音频谱信息和所述颗粒度的深度滤波器系数,得到降噪语音数据,包括:

5.根据权利要求1所述的方法,其特征在于,所述确定所述含噪语音数据的含噪语音频谱信息,基于所述含噪语音频谱信息和所述颗粒度的深度滤波器系数,得到降噪语音数据之后,还包括:将所述降噪语音数据输入预先训练的时间频域卷积循环网络模型进行评判。

6.根据权利要求5所述的方法,其特征在于,所述将所述降噪语音数据输入预先训练的时间频域卷积循环网络模型进行评判,包括通过以下方法训练所述时间频域卷积循环网络模型:

7.一种语音降噪装置,其特征在于,包括:

8.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至6任意一项所述的方法。

9.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行权利要求1至6任一所述方法。

10.一种计算机程序产品,其特征在于,包括计算机程序指令,当所述计算机程序指令在计算机上运行时,使得计算机执行如权利要求1至6任意一项所述的方法。


技术总结
本公开提供一种语音降噪方法、装置、电子设备、存储介质及程序产品,包括:确定含噪语音数据,基于含噪语音数据,得到频谱梅尔滤波器系数,对频谱梅尔滤波器系数特征进行提取,得到颗粒度的深度滤波器系数,确定含噪语音数据的含噪语音频谱信息,基于含噪语音频谱信息和颗粒度的深度滤波器系数,得到降噪语音数据。本公开通过卷积网络提取语音的嵌入特征信息,用循环网络提取语音的时序特征信息以实现语音降噪,提高语音听觉上的感知质量与可懂度。

技术研发人员:贺志强,牛凯,赵祖港,刘建兵,刘永辉
受保护的技术使用者:北京邮电大学
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-19004.html

最新回复(0)