音频信号处理方法、装置、电子设备及存储介质与流程

专利2025-05-23 87

本公开涉及音频数据处理领域，尤其涉及一种音频信号处理方法、装置、电子设备及存储介质。

背景技术：

1、听力是人与外界交流的重要桥梁，因此，优化多媒体资源的音频播放效果，成为提高用户对于多媒体资源的观看体验的一个重要途径。

2、现有技术可实现的音效优化大多是从场景角度出发设置的，例如模拟舞台剧的音效、模拟演唱会的音效等，而没有考虑到不同年龄的用户的音效偏好。相较于年轻用户，老年用户的听力更差，对声音的敏感度显著下降，同时老年用户心脏相对脆弱，一些音效可能会造成老年用户身体不适。

3、基于此，如何提高老年用户对多媒体资源的观看体验，并降低老年用户观看多媒体资源对身体健康造成不良影响，成为本领域的研究热点。

技术实现思路

1、有鉴于此，本公开提出了一种音频信号处理方法、装置、电子设备及存储介质。该方法支持为老年用户定制的长辈专属音效，并使目标多媒体资源的音频呈现长辈专属音效对应的特效，可提高老年用户对多媒体资源的观看体验，并减少老年用户观看多媒体资源对身体健康造成的不良影响。

2、根据本公开的一方面，提供了一种音频信号处理方法，所述方法包括：向用户展示目标多媒体资源支持的音效模式；响应于用户选择所述音效模式中的长辈专属音效，在播放所述目标多媒体资源时，使所述目标多媒体资源的音频呈现所述长辈专属音效对应的特效；其中，所述长辈专属音效对应的特效包括高频声音增强特效、人声增强特效、音频动态范围压缩特效中的至少一种，所述高频声音增强特效用于提升属于高频频段的信号的幅度，所述人声增强特效用于提升属于人声频段的信号的幅度，所述音频动态范围压缩特效用于压缩信号的动态范围。

3、在一种可能的实现方式中，响应于用户选择所述音效模式中的长辈专属音效，在播放所述目标多媒体资源时，使所述目标多媒体资源的音频呈现所述长辈专属音效对应的特效，包括：响应于用户选择所述音效模式中的长辈专属音效，基于所述长辈专属音效对应的特效对所述目标多媒体资源的原始音频进行处理，得到待播放音频；在播放所述目标多媒体资源时，使用所述待播放音频替换所述原始音频。

4、在一种可能的实现方式中，基于所述长辈专属音效对应的特效对所述目标多媒体资源的原始音频进行处理，得到待播放音频，包括：在所述原始音频的基础上，依次使用所述长辈专属音效对应的一种或多种特效进行渲染，得到所述待播放音频；其中，在所述长辈专属音效对应多种特效时，所述原始音频作为第一种特效待渲染的信号，前一种特效对应的渲染结果作为后一种特效待渲染的信号，最后一种特效对应的渲染结果作为所述待播放音频。

5、在一种可能的实现方式中，高频声音增强特效的渲染参数包括第一阈值和第一系数，所述基于所述长辈专属音效对应的特效对所述目标多媒体资源的原始音频进行处理，得到待播放音频，包括：使用高频声音增强特效对待渲染的信号进行渲染时，将待渲染的信号分为第一信号和第二信号，所述第一信号是高频频段的信号；根据第一系数提升所述第一信号的幅度，得到第三信号；比较所述第三信号的幅度和第一阈值的大小，在所述第三信号的幅度超出第一阈值时，将所述第三信号的幅度降低至第一阈值，得到第四信号；合并所述第四信号以及所述第二信号，作为所述高频声音增强特效对应的渲染结果。

6、在一种可能的实现方式中，人声增强特效的渲染参数包括第二系数和第三系数，所述基于所述长辈专属音效对应的特效对所述目标多媒体资源的原始音频进行处理，得到待播放音频，包括：使用人声增强特效对待渲染的信号进行渲染时，将待渲染的信号分为第五信号和第六信号，所述第五信号是人声频段的信号；根据第二系数提升所述第五信号的幅度，得到第七信号；根据第三系数降低所述第六信号中的噪声信号的幅度，得到第八信号；合并所述第七信号以及所述第八信号，作为所述人声增强特效对应的渲染结果。

7、在一种可能的实现方式中，所述音频动态范围压缩特效的渲染参数包括第二阈值、第三阈值、第四系数、第五系数，第二阈值大于第三阈值，所述基于所述长辈专属音效对应的特效对所述目标多媒体资源的原始音频进行处理，得到待播放音频，包括：使用音频动态范围压缩特效对待渲染的信号进行渲染时，比较所述待渲染的信号的幅度和第二阈值、第三阈值的大小；在所述待渲染的信号的幅度大于第二阈值时，根据第四系数降低所述待渲染的信号的幅度；在所述待渲染的信号的幅度小于第三阈值时，根据第五系数提升所述待渲染的信号的幅度。

8、在一种可能的实现方式中，所述方法还包括：在播放所述目标多媒体资源时，接收来自用户的反馈信号；根据所述反馈信号，调整所述长辈专属音效对应的至少一种特效的渲染参数。

9、在一种可能的实现方式中，所述长辈专属音效对应的任意一种特效的渲染参数是当前终端设备上预先设置的渲染参数，或当前终端设备上登录的用户账户预先设置的渲染参数。

10、在一种可能的实现方式中，所述方法还包括：响应于所述目标多媒体资源开始播放，查询当前终端设备的界面展示模式；响应于当前终端设备的界面展示模式为长辈模式，判断所述目标多媒体资源的播放状态是否满足第一预设条件；响应于当前终端设备的界面展示模式为长辈模式之外的其他模式，查询用户在当前终端设备的播放记录，或者，查询当前终端设备记录的用户身份信息；根据所述播放记录确定用户在当前终端设备播放多媒体资源时选择长辈专属音效的次数大于第四阈值的情况下，或者，根据所述用户身份信息确定用户的年龄大于第五阈值的情况下，判断所述目标多媒体资源的播放状态是否满足第一预设条件；响应于所述目标多媒体资源的播放状态满足第一预设条件，在播放所述目标多媒体资源时，使所述目标多媒体资源的音频呈现所述长辈专属音效对应的特效。

11、在一种可能的实现方式中，所述第一预设条件包括以下中的一项或多项：所述目标多媒体资源全屏播放的时长超出第六阈值；播放的音频是所述目标多媒体资源的原始音频；在当前终端设备的界面上全屏播放所述目标多媒体资源；所述目标多媒体资源处于播放状态；所述目标多媒体资源中尚未播放的内容的时长大于第七阈值。

12、在一种可能的实现方式中，在当前终端设备以长辈专属音效之外的其他音效模式播放目标多媒体资源的情况下，所述方法还包括：接收来自关联设备的音效模式选择信号，所述音效模式选择信号指示音效模式；在所述音效模式选择信号指示长辈专属音效时，使所述目标多媒体资源的音频呈现所述长辈专属音效对应的特效。

13、在一种可能的实现方式中，所述方法还包括：存储所述待播放音频，在用户再次播放目标多媒体资源，且处于所述长辈专属音效的音效模式时，直接使用存储的待播放音频替换所述原始音频。

14、根据本公开的另一方面，提供了一种音频信号处理装置，所述装置包括：展示模块，用于向用户展示目标多媒体资源支持的音效模式；第一音频处理模块，用于响应于用户选择所述音效模式中的长辈专属音效，在播放所述目标多媒体资源时，使所述目标多媒体资源的音频呈现所述长辈专属音效对应的特效；其中，所述长辈专属音效对应的特效包括高频声音增强特效、人声增强特效、音频动态范围压缩特效中的至少一种，所述高频声音增强特效用于提升属于高频频段的信号的幅度，所述人声增强特效用于提升属于人声频段的信号的幅度，所述音频动态范围压缩特效用于压缩信号的动态范围。

15、在一种可能的实现方式中，响应于用户选择所述音效模式中的长辈专属音效，在播放所述目标多媒体资源时，使所述目标多媒体资源的音频呈现所述长辈专属音效对应的特效，包括：响应于用户选择所述音效模式中的长辈专属音效，基于所述长辈专属音效对应的特效对所述目标多媒体资源的原始音频进行处理，得到待播放音频；在播放所述目标多媒体资源时，使用所述待播放音频替换所述原始音频。

16、在一种可能的实现方式中，基于所述长辈专属音效对应的特效对所述目标多媒体资源的原始音频进行处理，得到待播放音频，包括：在所述原始音频的基础上，依次使用所述长辈专属音效对应的一种或多种特效进行渲染，得到所述待播放音频；其中，在所述长辈专属音效对应多种特效时，所述原始音频作为第一种特效待渲染的信号，前一种特效对应的渲染结果作为后一种特效待渲染的信号，最后一种特效对应的渲染结果作为所述待播放音频。

17、在一种可能的实现方式中，高频声音增强特效的渲染参数包括第一阈值和第一系数，所述基于所述长辈专属音效对应的特效对所述目标多媒体资源的原始音频进行处理，得到待播放音频，包括：使用高频声音增强特效对待渲染的信号进行渲染时，将待渲染的信号分为第一信号和第二信号，所述第一信号是高频频段的信号；根据第一系数提升所述第一信号的幅度，得到第三信号；比较所述第三信号的幅度和第一阈值的大小，在所述第三信号的幅度超出第一阈值时，将所述第三信号的幅度降低至第一阈值，得到第四信号；合并所述第四信号以及所述第二信号，作为所述高频声音增强特效对应的渲染结果。

18、在一种可能的实现方式中，人声增强特效的渲染参数包括第二系数和第三系数，所述基于所述长辈专属音效对应的特效对所述目标多媒体资源的原始音频进行处理，得到待播放音频，包括：使用人声增强特效对待渲染的信号进行渲染时，将待渲染的信号分为第五信号和第六信号，所述第五信号是人声频段的信号；根据第二系数提升所述第五信号的幅度，得到第七信号；根据第三系数降低所述第六信号中的噪声信号的幅度，得到第八信号；合并所述第七信号以及所述第八信号，作为所述人声增强特效对应的渲染结果。

19、在一种可能的实现方式中，所述音频动态范围压缩特效的渲染参数包括第二阈值、第三阈值、第四系数、第五系数，第二阈值大于第三阈值，所述基于所述长辈专属音效对应的特效对所述目标多媒体资源的原始音频进行处理，得到待播放音频，包括：使用音频动态范围压缩特效对待渲染的信号进行渲染时，比较所述待渲染的信号的幅度和第二阈值、第三阈值的大小；在所述待渲染的信号的幅度大于第二阈值时，根据第四系数降低所述待渲染的信号的幅度；在所述待渲染的信号的幅度小于第三阈值时，根据第五系数提升所述待渲染的信号的幅度。

20、在一种可能的实现方式中，所述装置还包括：第一接收模块，用于在播放所述目标多媒体资源时，接收来自用户的反馈信号；调整模块，用于根据所述反馈信号，调整所述长辈专属音效对应的至少一种特效的渲染参数。

21、在一种可能的实现方式中，所述长辈专属音效对应的任意一种特效的渲染参数是当前终端设备上预先设置的渲染参数，或当前终端设备上登录的用户账户预先设置的渲染参数。

22、在一种可能的实现方式中，所述装置还包括：第一查询模块，用于响应于所述目标多媒体资源开始播放，查询当前终端设备的界面展示模式；第一判断模块，用于响应于当前终端设备的界面展示模式为长辈模式，判断所述目标多媒体资源的播放状态是否满足第一预设条件；第二查询模块，用于响应于当前终端设备的界面展示模式为长辈模式之外的其他模式，查询用户在当前终端设备的播放记录，或者，查询当前终端设备记录的用户身份信息；第二判断模块，用于根据所述播放记录确定用户在当前终端设备播放多媒体资源时选择长辈专属音效的次数大于第四阈值的情况下，或者，根据所述用户身份信息确定用户的年龄大于第五阈值的情况下，判断所述目标多媒体资源的播放状态是否满足第一预设条件；第二音频处理模块，用于响应于所述目标多媒体资源的播放状态满足第一预设条件，在播放所述目标多媒体资源时，使所述目标多媒体资源的音频呈现所述长辈专属音效对应的特效。

23、在一种可能的实现方式中，所述第一预设条件包括以下中的一项或多项：所述目标多媒体资源全屏播放的时长超出第六阈值；播放的音频是所述目标多媒体资源的原始音频；在当前终端设备的界面上全屏播放所述目标多媒体资源；所述目标多媒体资源处于播放状态；所述目标多媒体资源中尚未播放的内容的时长大于第七阈值。

24、在一种可能的实现方式中，所述装置还包括：第二接收模块，用于在当前终端设备以长辈专属音效之外的其他音效模式播放目标多媒体资源的情况下，接收来自关联设备的音效模式选择信号，所述音效模式选择信号指示音效模式；第三音频处理模块，用于在所述音效模式选择信号指示长辈专属音效时，使所述目标多媒体资源的音频呈现所述长辈专属音效对应的特效。

25、在一种可能的实现方式中，所述装置还包括：存储模块，用于存储所述待播放音频；替换模块，用于在用户再次播放目标多媒体资源，且处于所述长辈专属音效的音效模式时，直接使用存储的待播放音频替换所述原始音频。

26、根据本公开的另一方面，提供了一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为在执行所述存储器存储的指令时，实现上述方法。

27、根据本公开的另一方面，提供了一种非易失性计算机可读存储介质，其上存储有计算机程序指令，其中，所述计算机程序指令被处理器执行时实现上述方法。

28、根据本公开的另一方面，提供了一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，当所述计算机可读代码在电子设备的处理器中运行时，所述电子设备中的处理器执行上述方法。

29、根据本公开实施例的音频信号处理方法，通过向用户展示目标多媒体资源支持的音效模式，响应于用户选择音效模式中的长辈专属音效，在播放目标多媒体资源时，使目标多媒体资源的音频呈现长辈专属音效对应的特效，使得用户可以主动选择音效模式，且目标多媒体资源可以呈现长辈专属音效对应的特效；长辈专属音效对应的特效包括高频声音增强特效、人声增强特效、音频动态范围压缩特效中的至少一种，使得长辈专属音效对于音频的优化方式更多样化；高频声音增强特效用于提升属于高频频段的信号的幅度，使得老年用户对于高频频段的信号的听感更好。人声增强特效用于提升属于人声频段的信号的幅度，使得老年用户对于人声频段的信号的听感更好。音频动态范围压缩特效用于压缩信号的动态范围，减少老年用户观看多媒体资源对身体健康造成的不良影响。综上所述，本公开的音频信号处理方法支持为老年用户定制的长辈专属音效，并使目标多媒体资源的音频呈现长辈专属音效对应的特效，可提高老年用户对多媒体资源的观看体验，减少老年用户观看多媒体资源对身体健康造成的不良影响。

30、根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

技术特征：

1.一种音频信号处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，响应于用户选择所述音效模式中的长辈专属音效，在播放所述目标多媒体资源时，使所述目标多媒体资源的音频呈现所述长辈专属音效对应的特效，包括：

3.根据权利要求2所述的方法，其特征在于，基于所述长辈专属音效对应的特效对所述目标多媒体资源的原始音频进行处理，得到待播放音频，包括：

4.根据权利要求3所述的方法，其特征在于，高频声音增强特效的渲染参数包括第一阈值和第一系数，

5.根据权利要求3所述的方法，其特征在于，人声增强特效的渲染参数包括第二系数和第三系数，

6.根据权利要求3所述的方法，其特征在于，所述音频动态范围压缩特效的渲染参数包括第二阈值、第三阈值、第四系数、第五系数，第二阈值大于第三阈值，

7.根据权利要求1-6中任一项所述的方法，其特征在于，所述方法还包括：

8.根据权利要求1-6中任一项所述的方法，其特征在于，所述长辈专属音效对应的任意一种特效的渲染参数是当前终端设备上预先设置的渲染参数，或当前终端设备上登录的用户账户预先设置的渲染参数。

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

10.根据权利要求9所述的方法，其特征在于，所述第一预设条件包括以下中的一项或多项：

11.根据权利要求1所述的方法，其特征在于，在当前终端设备以长辈专属音效之外的其他音效模式播放目标多媒体资源的情况下，所述方法还包括：

12.根据权利要求2所述的方法，其特征在于，所述方法还包括：

13.一种音频信号处理装置，其特征在于，所述装置包括：

14.一种电子设备，其特征在于，包括：

15.一种非易失性计算机可读存储介质，其上存储有计算机程序指令，其特征在于，所述计算机程序指令被处理器执行时实现权利要求1至12中任意一项所述的方法。

技术总结
本公开涉及音频数据处理领域，提出一种音频信号处理方法、装置、电子设备及存储介质。所述方法包括：向用户展示目标多媒体资源支持的音效模式；响应于用户选择长辈专属音效，在播放目标多媒体资源时，使目标多媒体资源的音频呈现长辈专属音效对应的特效；长辈专属音效对应的特效包括高频声音增强特效、人声增强特效、音频动态范围压缩特效中的至少一种，高频声音增强特效用于提升属于高频频段的信号的幅度，人声增强特效用于提升属于人声频段的信号的幅度，音频动态范围压缩特效用于压缩信号的动态范围。该方法支持为老年用户定制的长辈专属音效，可提高老年用户对多媒体资源的观看体验，减少老年用户观看多媒体资源对身体健康造成的不良影响。

技术研发人员：王媛,贾超,降文娟,刘邦,陈贺达,王盈韬
受保护的技术使用者：北京优酷科技有限公司
技术研发日：
技术公布日：2024/11/11

转载请注明原文地址: https://tieba.8miu.com/read-14262.html

专利

最新回复(0)