拾音控制方法、拾音控制装置、电子设备及存储介质与流程

专利2024-02-20  118



1.本技术涉及拾音技术领域,更具体地,涉及一种拾音控制方法、拾音控制装置、电子设备及存储介质。


背景技术:

2.开会是日常办公的重要活动之一,在会议过程中,常常利用拾音器录制与会演讲者的人声数据,以便进行备案、扩音或者其他应用(比如用于语音识别)。
3.目前会议过程中,为了清晰的录制不同与会演讲者的人声数据,通常在每个与会者面前设置一个拾音器,如图1所示,并通过每个拾音器拾取对应的与会演讲者的人声数据。
4.然而,当距离较近的多个与会者同时演讲时,对应的拾音器同时拾取到多个与会者演讲者的人声数据,导致拾音器拾取到串音的人声数据,从而导致拾音器的拾音效果较差。


技术实现要素:

5.鉴于上述问题,本技术提出了一种拾音控制方法、拾音控制装置、电子设备及存储介质,以克服或者至少部分地解决以上现有技术的问题。
6.第一方面,本技术实施例提供了一种拾音控制方法,包括:获取拾音器拾取的语音信息;当确定语音信息包含多个人声数据时,确定多个人声数据中是否包含拾音器关联的目标声纹信息;当确定多个人声数据中包含拾音器关联的目标声纹信息时调整拾音器的拾音参数,使得拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,第一预设强度大于第二预设强度。
7.第二方面,本技术实施例提供了一种拾音控制装置,包括语音获取模块、声纹确定模块以及调整模块。语音获取模块,用于获取拾音器拾取的语音信息;声纹确定模块,用于当确定语音信息包含多个人声数据时,确定多个人声数据中是否包含拾音器关联的目标声纹信息;调整模块,用于当确定多个人声数据中包含拾音器关联的目标声纹信息时调整拾音器的拾音参数,使得拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,第一预设强度大于第二预设强度。
8.第三方面,本技术实施例提供了一种电子设备,包括存储器;一个或多个处理器,与存储器耦接;一个或多个应用程序,其中,一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个应用程序配置用于执行如上述第一方面提供的拾音控制方法。
9.第四方面,本技术实施例提供了一种计算机可读取存储介质,计算机可读取存储介质中存储有程序代码,程序代码可被处理器调用执行如上述第一方面提供的拾音控制方
法。
10.本技术提供的方案,通过获取拾音器拾取的语音信息,并当确定语音信息包含多个人声数据时,确定多个人声数据中是否包含拾音器关联的目标声纹信息,并当确定多个人声数据中包含拾音器关联的目标声纹信息时调整拾音器的拾音参数,使得拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,第一预设强度大于第二预设强度,实现了根据拾音器拾取到的人声数据以及拾音器关联的目标声纹信息,调整拾音器的拾音参数,可避免拾音器同时拾取到多个与会者的人声数据而产生串音,提高了拾音器的拾音效果。
附图说明
11.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
12.图1示出了现有技术中拾音控制系统的一种应用场景示意图。
13.图2示出了本技术实施例提供的拾音控制系统的一种应用场景示意图。
14.图3示出了本技术实施例提供的拾音控制方法的一种流程示意图。
15.图4示出了本技术实施例提供的拾音控制方法中的拾音器调整的一种应用场景示意图。
16.图5示出了本技术实施例提供的拾音控制方法的另一种流程示意图。
17.图6示出了本技术实施例提供的拾音控制方法的再一种流程示意图。
18.图7示出了本技术实施例提供的拾音控制装置的一种结构框图。
19.图8示出了本技术实施例提供的电子设备的一种结构框图。
20.图9示出了本技术实施例提供的用于保存或者携带现实根据本技术实施例提供的拾音控制方法的程序代码的计算机可读存储介质。
具体实施方式
21.下面详细描述本技术的实施方式,实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本技术,而不能理解为对本技术的限制。
22.下文的公开提供了许多不同的实施方式或例子用来实现本技术的不同结构。为了简化本技术的公开,下文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本技术。此外,本技术可以在不同例子中重复参考数字和/或参考字母,这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施方式和/或设置之间的关系。
23.开会是日常办公的重要活动之一,在会议过程中,常常利用拾音器录制与会演讲者的人声数据,以便进行备案、扩音或者其他应用(比如用于语音识别)。
24.目前会议过程中,为了清晰的录制不同与会演讲者的人声数据,通常在每个与会
者面前设置一个拾音器,如图1所示,并通过每个拾音器拾取对应的与会演讲者的人声数据。
25.然而,当距离较近的多个与会者同时演讲时,对应的拾音器同时拾取到多个与会者演讲者的人声数据,导致拾音器拾取到串音的人声数据,从而导致拾音器的拾音效果较差。
26.针对上述问题,发明人经过长时间的研究并提出了本技术实施例提供的拾音控制方法、拾音控制装置、电子设备及存储介质,实现了根据拾音器拾取到的人声数据以及拾音器关联的目标声纹信息,调整拾音器的拾音参数,可避免拾音器同时拾取到多个与会者的人声数据而产生串音,提高了拾音器的拾音效果。
27.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。
28.请参阅图2,其示出了本技术实施例提供的拾音控制系统的一种应用场景示意图,包括控制器100以及拾音器200,控制器100与拾音器200通信连接,并与拾音器200进行数据交互。控制器100可以用于控制拾音器200的工作;拾音器200可以用于对拾音器200所处环境中的声音数据进行拾取。
29.其中,控制器100可以为可编程逻辑控制器(programmable logic controller,plc)、单片机(single chip microcomputer,scm)控制器、中央处理器(central processing unit)控制器等中的任一种;拾音器200可以为麦克风、或者内置有用于提取声音数据的应用程序的拾音设备等;此处处不限定控制器100以及拾音器200的类型,具体可以根据实际需求进行设置。
30.在本技术实施例中,拾音器200为多个,多个拾音器200均与控制器100通信连接,并与控制器100进行数据交互。每个拾音器200对应于一个与会者进行设置,每个拾音器200可以用于拾取对应的与会者的声音数据。
31.在一些实施方式中,拾音器200可以设置有拾音开关,拾音开关可以用于开启或者关闭拾音器200的语音拾取功能。在会议过程中,当拾音器200的拾音开关处于开启状态时,拾音器200的语音拾取功能被开启,拾音器200对其所处环境的语音信息进行拾取,获得对应的语音信息;当拾音器200的拾音开关处于关闭状态时,拾音器200的语音拾取功能被关闭,拾音器200不拾取任何语音信息。此外,拾音器200还可以配置有其他功能,例如,语音播放功能、语音识别功能等,此处不作限定。
32.请参阅图3,其示出了本技术一个实施例提供的拾音控制方法的流程图。在具体的实施例中,拾音控制方法可以应用于如图2所示的拾音控制系统中的控制器100,下面将以控制器100为例,对图3所示的流程进行详细阐述,拾音控制方法可以包括步骤s110至步骤s130。
33.步骤s110:获取拾音器拾取的语音信息。
34.在本技术实施例中,拾音器为多个,每个拾音器对应于一个与会者进行设置。拾音器可以为语音拾取功能以及其他功能均被开启的拾音设备(例如,开启语音拾取功能以及语音播放功能的拾音设备);也可以为语音拾取功能被开启且其他功能被关闭的拾音设备(例如,开启语音拾取功能但关闭语音播放功能的拾音设备)等。其中,语音拾取功能被开启且其他功能被关闭的拾音设备仅用于辅助调整拾音范围,该拾音设备拾取的语音信息并不
会被存储。
35.会议过程中,为了避免拾音器拾取到串音的人声数据,控制器可以发送语音获取指令至拾音器,拾音器接收并响应语音获取指令,对拾音器所处环境的语音信息进行拾取,并将拾取到的语音信息发送至控制器,控制器接收拾音器返回的语音信息。其中,语音信息为包括人声数据的环境声音信息。
36.在一些实施方式中,控制器在获取到拾音器拾取的语音信息之后,可以对语音信息进行分析,获得分析结果,并根据分析结果,确定语音信息是否包含多个人声数据。
37.具体地,分析结果可以为声纹特征信息。控制器在获取到拾音器拾取的语音信息之后,可以将语音信息输入预先训练的声纹特征提取模型,声纹特征提取模型接收并响应语音信息,将语音信息对应的声纹特征信息输出至控制器,控制器接收声纹特征提取模型输出的声纹特征信息,并根据声纹特征信息,确定语音信息是否包含多个人声数据。
38.当声纹特征信息为多个时,则确定语音信息包含多个人声数据;当声纹特征信息为单个时,则确定语音信息未包含多个人声数据。
39.其中,声纹特征提取模型可以用于提取语音信息对应的声纹特征信息,声纹特征提取模型可以为卷积神经网络(convolutional neural networks,cnn)模型、深度置信网络(deep belief networks,dbn)模型、堆栈自编码网络(stacked auto encoder networks,sae)模型、循环神经网络(recurrent neural networks,rnn)模型、深度神经网络(deep neural networks,dnn)模型、长短期记忆(long short-term memory,lstm)网络模型或者门限循环单元(gated recurring units,gru)模型等,此处不限定声纹特征提取模型的类型,具体可以根据实际需求进行设置。
40.步骤s120:当确定语音信息包含多个人声数据时,确定多个人声数据中是否包含拾音器关联的目标声纹信息。
41.在申请实施例中,当控制器确定语音信息包含多个人声数据时,可以将语音信息对应的声纹特征信息与拾音器关联的目标声纹信息进行匹配,获得声纹匹配度,并可以根据声纹匹配度,确定多个人声数据中是否包含拾音器关联的目标声纹信息。
42.当声纹匹配度大于或者等于声纹匹配度阈值时,则确定多个人声数据中包含拾音器关联的目标声纹信息;当声纹匹配度小于声纹匹配度阈值时,则确定多个人声数据中未包含拾音器关联的目标声纹信息。
43.步骤s130:当确定多个人声数据中包含拾音器关联的目标声纹信息时调整拾音器的拾音参数。
44.在本技术实施例中,当控制器确定多个人声数据中包含拾音器关联的目标声纹信息时,可以发送第一调整指令至拾音器,拾音器接收并响应第一调整指令,对拾音器的拾音参数进行调整,使得拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,第一预设强度大于第二预设强度,实现了根据拾音器拾取到的人声数据以及拾音器关联的目标声纹信息,调整拾音器的拾音参数,可避免拾音器同时拾取到多个与会者的人声数据而产生串音,提高了拾音器的拾音效果。其中,拾音参数可以为拾音方向、拾音角度等中的至少任一种。
45.在一些实施方式中,当控制器确定多个人声数据中包含拾音器关联的目标声纹信
息时,可以对多个人声数据进行分析,获得对应的语音强度信息,并根据语音强度信息,确定拾音器的第一拾音参数,并发送携带有第一拾音参数的第一调整指令至拾音器,拾音器接收并响应第一调整指令,调整拾音参数至第一拾音参数。
46.其中,第一拾音参数用于表征拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度。第一拾音参数可以为拾音方向、拾音角度等中的至少任一种。
47.作为一种实施方式,第一拾音参数可以用于表征拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,第一调整指令可以为第一指令。
48.当控制器确定多个人声数据中包含拾音器关联的目标声纹信息时,可以对多个人声数据进行分析,获得对应的语音强度信息,并根据语音强度信息,确定拾音器的第一拾音参数,并发送携带有第一拾音参数的第一指令至拾音器,拾音器接收并响应第一指令,调整拾音器的拾音参数至第一拾音参数,使得拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度。
49.作为另一种实施方式,第一拾音参数可以用于表征拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,第一调整指令可以为第二指令。
50.当控制器确定多个人声数据中包含拾音器关联的目标声纹信息时,可以对多个人声数据进行分析,获得对应的语音强度信息,并根据语音强度信息,确定拾音器的第一拾音参数,并发送携带有第一拾音参数的第二指令至拾音器,拾音器接收并响应第二指令,调整拾音器的拾音参数至第一拾音参数,使得拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度。
51.作为再一种实施方式,第一拾音参数可以用于表征拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,第一调整指令可以为第三指令。
52.当控制器确定多个人声数据中包含拾音器关联的目标声纹信息时,可以对多个人声数据进行分析,获得对应的语音强度信息,并根据语音强度信息,确定拾音器的第一拾音参数,并发送携带有第一拾音参数的第三指令至拾音器,拾音器接收并响应第三指令,调整拾音器的拾音参数至第一拾音参数,使得拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度。
53.在一些实施方式中,拾音器可以为用于表征待调整的第一目标拾音器,当控制器确定多个人声数据中包含拾音器关联的目标声纹信息时,可以根据是否同时接收多个拾音器发送的语音信息,确定是否多个拾音器拾取到该语音信息,获得确定结果,并根据确定结果,确定对应的第一目标拾音器,并对多个人声数据进行分析,获得多个人声数据对应的语音强度信息,并根据语音强度信息,确定第一目标拾音器的第一拾音参数,并调整第一目标拾音器的拾音参数至第一拾音参数。
54.其中,确定结果可以包括用于表征确定单个拾音器拾取到语音信息的结果,以及用于表征确定多个拾音器拾取到语音信息的结果。当未同时接收到多个拾音器发送的语音信息时,则确定单个拾音器拾取到语音信息;当同时接收到多个拾音器发送的语音信息时,
则确定多个拾音器拾取到语音信息。
55.作为一种实施方式,确定结果可以为用于表征确定单个拾音器拾取到语音信息的结果,当控制器确定多个人声数据中包含拾音器关联的目标声纹信息时,根据未同时接收到多个拾音器发送的语音信息,确定单个拾音器拾取到语音信息,将获取到语音信息的拾音器确定为第一目标拾音器,并对多个人声数据进行分析,获得多个人声数据对应的语音强度信息,并根据该语音强度信息,确定第一目标拾音器的第一拾音参数,并调整第一目标拾音器的拾音参数至第一拾音参数。
56.作为另一种实施方式,确定结果可以为用于表征确定多个拾音器拾取到语音信息的结果,当控制器确定多个人声数据中包含拾音器关联的目标声纹信息时,根据同时接收到多个拾音器发送的语音信息,确定多个拾音器拾取到语音信息时,将目标声纹信息关联的拾音器确定为第一目标拾音器,并对每个拾音器拾取到的多个人声数据进行分析,获得对应的语音强度信息,并根据该语音强度信息,确定第一目标拾音器的第一拾音参数,并调整第一目标拾音器的拾音参数至第一拾音参数。
57.在一种应用场景中,多个拾音器设置为麦克风阵列,当控制器确定麦克风阵列拾取到语音信息时,可以通过多重信号分类(multiple signal classification,music)算法估计每个麦克风对应的演讲者数量以及拾音方向。当控制器根据music算法估计每个麦克风对应的演讲者数量为1时,表示多个演讲者的声源方位比较接近或者完全重叠,控制器可以生成对应的提示信息,以提示与会者调整彼此之间的距离。当控制器根据music算法估计每个麦克风对应的演讲者数量大于或者等于2时,控制器可以将与麦克风阵列的中心方位最接近的演讲者的目标声源方位确定为目标方位(目标拾音方向),并采用可控波束形成算法设计波束模式,对目标拾音方向进行调整至目标声源位于该麦克风的拾音范围内,如图4所示。
58.在一些实施方式中,当控制器确定多个人声数据中未包含拾音器关联的目标声纹信息,可以发送第二调整指令至拾音器,拾音器接收并响应第二调整指令,关闭语音拾取功能,可避免与会者的人声数据同时被多个拾音器拾取而产生串音,进一步地提高了拾音器的拾音效果。
59.本技术提供的方案,通过获取拾音器拾取的语音信息,并当确定语音信息包含多个人声数据时,确定多个人声数据中是否包含拾音器关联的目标声纹信息,并当确定多个人声数据中包含拾音器关联的目标声纹信息时调整拾音器的拾音参数,使得拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,第一预设强度大于第二预设强度,实现了根据拾音器拾取到的人声数据以及拾音器关联的目标声纹信息,调整拾音器的拾音参数,可避免拾音器同时拾取到多个与会者的人声数据而产生串音,提高了拾音器的拾音效果。
60.请参阅图5,其示出了本技术另一个实施例提供的拾音控制方法的流程图。在具体的实施例中,拾音控制方法可以应用于如图2所示的拾音控制系统中的控制器100,下面将以控制器100为例,对图5所示的流程进行详细阐述,拾音控制方法可以包括步骤s210至步骤s250。
61.步骤s210:获取拾音器拾取的语音信息。
62.在本实施例中,步骤s210可以参阅前述实施例中相应步骤的内容,此处不再赘述。
63.步骤s220:当确定语音信息包含多个人声数据时,获取拾音器的配置信息。
64.在本实施例中,配置信息可以用于表征拾音器已被配置功能对应的信息,或/及,已被配置属性对应的信息等。当控制器确定语音信息包含多个人声数据时,可以获取拾音器的配置信息,以便根据配置信息确定拾音器是否已关联目标声纹信息。
65.在一些实施方式中,拾音器的配置信息预先存储于拾音器的本地存储器。当控制器确定语音信息包含多个人声数据时,可以发送第一配置信息获取指令至拾音器,拾音器接收并响应第一配置信息获取指令,从本地存储器读取对应的配置信息,并将配置信息发送至控制器,控制器接收拾音器返回的配置信息。
66.在一些实施方式中,拾音控制系统还可以包括服务器,服务器中预先存储有拾音器的配置信息,服务器与控制器通过网络通信连接,并通过网络与控制器进行数据交互。
67.当控制器确定语音信息包含多个人声数据时,可以通过网络发送第二配置信息获取指令服务器,服务器接收并响应第二配置信息获取指令,读取预先存储的拾音器的配置信息,并将拾音器的配置信息通过网络发送至控制器,控制器接收服务器返回的配置信息。
68.其中,服务器可以为独立的物理服务器,也可以为多个物理服务器构成的服务器集群或者分布式系统,还可以为提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、大数据以及人工智能平台等基础云计算服务的云服务器等。
69.网络可以为紫蜂(zigbee)网络、蓝牙(bluetooth,bt)网络、无线保真(wireless fidelity,wi-fi)网络、家庭物联网通讯协定技术(thread)网络、远距离无线电(long range radio,lora)网络、低功率广域网络(low-power wide-area network,lpwan)、红外网络、窄带物联网(narrow band internet of things,nb-iot)、基于控制器局域网络(controller area network,can)、数字生活网络联盟(digital living network alliance,dlna)网络、广域网(wide area network,wan)、局域网(local area network,lan)、城域网(metropolitan area network,man)以及无线个人局域网(wireless personal area network,wpan)等。
70.步骤s230:根据配置信息,确定拾音器是否已关联目标声纹信息。
71.在本实施例中,当控制器获取到拾音器的配置信息之后,可以将配置信息与预设关键词进行匹配,获得关键词匹配度,并可以根据关键词匹配度,确定拾音器是否已关联目标声纹信息。
72.当关键词匹配度大于或者等于关键词匹配度阈值时,则确定拾音器已关联目标声纹信息;当关键词匹配度小于关键词匹配度阈值时,则确定拾音器未关联目标声纹信息。
73.其中,预设关键词可以用于表征拾音器关联的目标声纹信息,例如,预设关键词可以为“声纹信息”,预设关键词也可以为“声纹”和“信息”等,此处不作限定。
74.步骤s240:当根据配置信息确定拾音器已关联目标声纹信息时,确定多个人声数据中是否包含拾音器关联的目标声纹信息。
75.在本实施例中,步骤s240可以参阅前述实施例中相应步骤的内容,此处不再赘述。
76.步骤s250:当确定多个人声数据中未包含拾音器关联的目标声纹信息时,将拾音器的拾音参数调整至第二拾音参数。
77.在本实施例中,当控制器确定多个人声数据中未包含拾音器关联的目标声纹信息时,发送携带有第二拾音参数的第三调整指令至拾音器,拾音器接收并响应第三调整指令,调整拾音参数至第二拾音参数,第二拾音参数用于表征拾音器的语音拾取功能被关闭,可避免与会者的人声数据同时被多个拾音器拾取而产生串音,提高了拾音器的拾音效果。
78.在一些实施方式中,当控制器根据配置信息确定拾音器未关联目标声纹信息时,可以发送第四调整指令至拾音器,拾音器接收并响应第四调整指令,关闭语音拾取功能并处于低功耗运行状态,可避免与会者的人声数据同时被多个拾音器拾取而产生串音,提高了拾音器的拾音效果的同时,并降低了拾音功耗。
79.本实施例提供的方案,通过获取拾音器拾取的语音信息,并当确定语音信息包含多个人声数据时,获取拾音器的配置信息,并根据配置信息,确定拾音器是否已关联目标声纹信息,并当根据配置信息确定拾音器已关联目标声纹信息时,确定多个人声数据中是否包含拾音器关联的目标声纹信息,以及当确定多个人声数据中未包含拾音器关联的目标声纹信息时,将拾音器的拾音参数调整至第二拾音参数,实现了根据拾音器拾取到的人声数据以及拾音器关联的目标声纹信息,调整拾音器的拾音参数,可避免与会者的人声数据同时被多个拾音器拾取而产生串音,提高了拾音器的拾音效果。
80.请参阅图6,其示出了本技术再一个实施例提供的拾音控制方法的流程图。在具体的实施例中,拾音控制方法可以应用于如图2所示的拾音控制系统中的控制器100,下面将以控制器100为例,对图6所示的流程进行详细阐述,拾音控制方法可以包括步骤s310至步骤s340。
81.步骤s310:获取拾音器拾取的语音信息。
82.步骤s320:当确定语音信息未包含多个人声数据时,确定是否多个拾音器拾取到语音信息。
83.在本实施例中,步骤s310以及步骤s320可以参阅前述实施例中相应步骤的内容,此处不再赘述。
84.步骤s330:当确定多个拾音器拾取到语音信息时,根据每个拾音器拾取到的语音信息对应的单个人声数据,确定第二目标拾音器。
85.在本实施例中,当控制器确定多个拾音器拾取到语音信息时,可以对每个拾音器拾取到的语音信息对应的单个人声数据进行分析,获得对应的语音强度信息和拾音距离,并根据每个拾音器对应的语音强度信息和拾音距离,计算每个拾音器对应的单位能量参数,并将多个单位能量参数按照从大到小的顺序进行排序,并获取单位能量参数最大的拾音器,并作为第二目标拾音器。
86.其中,拾音距离用于表征拾音器拾取到人声数据的拾取距离;单位能量参数用于表征单位拾音距离的语音强度信息;第二目标拾音器用于表征需要拾取单个人声数据的拾音器。
87.步骤s340:将非第二目标拾音器的拾音参数调整至第三拾音参数,第三拾音参数用于表征非第二目标拾音器的语音拾取功能被关闭。
88.在本实施例中,控制器在根据每个拾音器拾取到的语音信息对应的单个人声数据,确定第二目标拾音器之后,可以发送第五调整指令至非第二目标拾音器,非第二目标拾音器接收并响应第五调整指令,调整对应的拾音参数至第三拾音参数,第三拾音参数用于
表征非第二目标拾音器的语音拾取功能被关闭,可避免多个拾音器同时拾取与会者的人声数据导致功耗增加,降低了拾音功耗。
89.本实施例提供的方案,通过获取拾音器拾取的语音信息,并当确定语音信息未包含多个人声数据时,确定是否多个拾音器拾取到语音信息,并当确定多个拾音器拾取到语音信息时,根据每个拾音器拾取到的语音信息对应的单个人声数据,确定第二目标拾音器,并将非第二目标拾音器的拾音参数调整至第三拾音参数,第三拾音参数用于表征非第二目标拾音器的语音拾取功能被关闭,实现了根据多个拾音器拾取到的单个人声数据,关闭非第二目标拾音器,可避免多个拾音器同时拾取与会者的人声数据导致功耗增加,降低了拾音功耗。
90.请参阅图7,其示出了本技术一个实施例提供的拾音控制装置400,拾音控制装置400可以应用于如图2所示的拾音控制系统中的控制器100,下面将以控制器100为例,对图7所示的拾音控制装置400进行详细阐述,拾音控制装置400可以包括语音获取模块410、声纹确定模块420以及调整模块430。
91.语音获取模块410可以用于获取拾音器拾取的语音信息;声纹确定模块420可以用于当确定语音信息包含多个人声数据时,确定多个人声数据中是否包含拾音器关联的目标声纹信息;调整模块430可以用于当确定多个人声数据中包含拾音器关联的目标声纹信息时调整拾音器的拾音参数,使得拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,第一预设强度大于第二预设强度。
92.在一些实施方式中,调整模块430可以包括第一确定单元以及调整单元。
93.第一确定单元可以用于当确定多个人声数据中包含拾音器关联的目标声纹信息时,根据多个人声数据确定拾音器的第一拾音参数,第一拾音参数用于表征拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,且拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度;调整单元可以用于调整拾音器的拾音参数至第一拾音参数。
94.在一些实施方式中,拾音控制装置400还可以包括语音确定模块。
95.语音确定模块可以用于当第一确定单元确定多个人声数据中包含拾音器关联的目标声纹信息时,根据多个人声数据确定拾音器的第一拾音参数之前,确定是否多个拾音器拾取到语音信息。
96.在一些实施方式中,第一确定单元可以包括第一确定子单元、第一分析子单元以及第二确定子单元。
97.第一确定子单元可以用于当确定单个拾音器拾取到语音信息时,将获取到语音信息的拾音器确定为第一目标拾音器;第一分析子单元可以用于对多个人声数据进行分析,获得对应的语音强度信息;第二确定子单元可以用于根据语音强度信息,确定第一目标拾音器的第一拾音参数。
98.在一些实施方式中,第一确定单元还可以包括第三确定子单元、第二分析子单元以及第四确定子单元。
99.第三确定子单元可以用于当确定多个拾音器拾取到语音信息时,将目标声纹信息关联的拾音器确定为第一目标拾音器;第二分析子单元可以用于对每个拾音器拾取到的多
个人声数据进行分析,获得对应的语音强度信息;第四确定子单元可以用于根据语音强度信息,确定第一目标拾音器的第一拾音参数。
100.在一些实施方式中,拾音控制装置400还可以包括配置信息获取模块以及关联确定模块。
101.配置信息获取模块可以用于声纹确定模块420确定多个人声数据中是否包含拾音器关联的目标声纹信息之前,获取拾音器的配置信息;关联确定模块可以用于根据配置信息,确定拾音器是否已关联目标声纹信息。
102.在一些实施方式中,声纹确定模块420可以包括第二确定单元。
103.第二确定单元可以用于当根据配置信息确定拾音器已关联目标声纹信息时,确定多个人声数据中是否包含拾音器关联的目标声纹信息。
104.在一些实施方式中,拾音控制装置400还可以包括第一关闭模块。
105.第一关闭模块可以用于当确定多个人声数据中未包含拾音器关联的目标声纹信息时,将拾音器的拾音参数调整至第二拾音参数,第二拾音参数用于表征拾音器的语音拾取功能被关闭。
106.在一些实施方式中,拾音控制装置400还可以包括拾音确定模块、拾音器确定模块以及第二关闭模块。
107.拾音确定模块可以用于当确定语音信息未包含多个人声数据时,确定是否多个拾音器拾取到语音信息;拾音器确定模块可以用于当确定多个拾音器拾取到语音信息时,根据每个拾音器拾取到的语音信息对应的单个人声数据,确定第二目标拾音器;第二关闭模块可以用于将非第二目标拾音器的拾音参数调整至第三拾音参数,第三拾音参数用于表征非第二目标拾音器的语音拾取功能被关闭。
108.在一些实施方式中,拾音器确定模块可以包括分析模块、计算模块、排序模块以及拾音器获取模块。
109.分析模块可以用于当确定多个拾音器拾取到语音信息时,对每个拾音器拾取到的语音信息对应的单个人声数据进行分析,获得对应的语音强度信息和拾音距离,拾音距离用于表征拾音器拾取到人声数据的拾取距离;计算模块可以用于根据每个拾音器对应的语音强度信息和拾音距离,计算每个拾音器对应的单位能量参数,单位能量参数用于表征单位拾音距离的语音强度信息;排序模块可以用于将多个单位能量参数按照从大到小的顺序进行排序;拾音器获取模块可以用于获取单位能量参数最大的拾音器,并作为第二目标拾音器。
110.本技术提供的方案,通过获取拾音器拾取的语音信息,并当确定语音信息包含多个人声数据时,确定多个人声数据中是否包含拾音器关联的目标声纹信息,并当确定多个人声数据中包含拾音器关联的目标声纹信息时调整拾音器的拾音参数,使得拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,第一预设强度大于第二预设强度,实现了根据拾音器拾取到的人声数据以及拾音器关联的目标声纹信息,调整拾音器的拾音参数,可避免拾音器同时拾取到多个与会者的人声数据而产生串音,提高了拾音器的拾音效果。
111.需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重
点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。对于方法实施例中的所描述的任意的处理方式,在装置实施例中均可以通过相应的处理模块实现,装置实施例中不再一一赘述。
112.另外,在本技术各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
113.请参阅图8,其示出了本技术另一个实施例提供的电子设备500的功能框图,该电子设备500可以包括一个或多个如下部件:存储器510、处理器520、以及一个或多个应用程序,其中一个或多个应用程序可以被存储在存储器510中并被配置为由一个或多个处理器520执行,一个或多个应用程序配置用于执行如前述方法实施例所描述的方法。
114.存储器510可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read-only memory)。存储器510可用于存储指令、程序、代码、代码集或指令集。存储器510可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如获取语音信息、拾取语音信息、确定语音信息包含多个人声数据、确定多个人声数据中是否包含目标声纹信息、调整拾音参数、增强语音强度为第一预设强度、降低语音强度为第二预设强度、确定第一拾音参数、调整拾音参数至第一拾音参数、确定是否多个拾音器拾取到语音信息、确定第一目标拾音器、分析多个人声数据、获得语音强度信息、获取配置信息、调整拾音参数至第二拾音参数、关闭语音拾取功能、确定第二目标拾音器、调整拾音参数至第三拾音参数、分析单个人声数据、获得拾音距离、计算单位能量参数、排序单位能量参数以及获取最大能量参数等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备500在使用中所创建的数据(比如拾音器、语音信息、多个人声数据、目标声纹信息、拾音参数、目标人声数据、语音强度、第一预设强度、非目标声纹信息、非目标人声数据、第二预设强度、第一拾音参数、第一目标拾音器、语音强度信息、配置信息、第二拾音参数、语音拾取功能、单个人声数据、第二目标拾音器、非第二目标拾音器、第三拾音参数、拾音距离、人声数据、拾取距离、单位能量参数、单位拾音距离的语音强度信息以及从大到小的顺序)等。
115.处理器520可以包括一个或者多个处理核。处理器520利用各种接口和线路连接整个电子设备500内的各个部分,通过运行或执行存储在存储器510内的指令、程序、代码集或指令集,以及调用存储在存储器510内的数据,执行电子设备500的各种功能和处理数据。可选地,处理器520可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器520可集成中央处理器(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器520中,单独通过一块通信芯片进行实现。
116.请参考图9,其示出了本技术实施例提供的一种计算机可读存储介质的结构框图。该计算机可读存储介质600中存储有程序代码610,程序代码610可被处理器调用执行上述
方法实施例中所描述的方法。
117.计算机可读存储介质600可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。可选地,计算机可读存储介质600包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质600具有执行上述方法中的任何方法步骤的程序代码610的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码610可以例如以适当形式进行压缩。
118.本技术提供的方案,通过获取拾音器拾取的语音信息,并当确定语音信息包含多个人声数据时,确定多个人声数据中是否包含拾音器关联的目标声纹信息,并当确定多个人声数据中包含拾音器关联的目标声纹信息时调整拾音器的拾音参数,使得拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,第一预设强度大于第二预设强度,实现了根据拾音器拾取到的人声数据以及拾音器关联的目标声纹信息,调整拾音器的拾音参数,可避免拾音器同时拾取到多个与会者的人声数据而产生串音,提高了拾音器的拾音效果。
119.最后应说明的是:以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。

技术特征:
1.一种拾音控制方法,其特征在于,包括:获取拾音器拾取的语音信息;当确定所述语音信息包含多个人声数据时,确定所述多个人声数据中是否包含所述拾音器关联的目标声纹信息;当确定所述多个人声数据中包含所述拾音器关联的目标声纹信息时调整所述拾音器的拾音参数,使得所述拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或所述拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,所述第一预设强度大于所述第二预设强度。2.根据权利要求1所述的拾音控制方法,其特征在于,所述当确定所述多个人声数据中包含所述拾音器关联的目标声纹信息时调整所述拾音器的拾音参数,包括:当确定所述多个人声数据中包含所述拾音器关联的目标声纹信息时,根据所述多个人声数据确定所述拾音器的第一拾音参数,所述第一拾音参数用于表征所述拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为所述第一预设强度,和/或所述拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为所述第二预设强度;调整所述拾音器的拾音参数至所述第一拾音参数。3.根据权利要求2所述的拾音控制方法,其特征在于,所述根据所述多个人声数据确定所述拾音器的第一拾音参数之前,还包括:确定是否多个拾音器拾取到所述语音信息;所述根据所述多个人声数据确定所述拾音器的第一拾音参数,包括:当确定单个拾音器拾取到所述语音信息时,将获取到所述语音信息的拾音器确定为第一目标拾音器;对所述多个人声数据进行分析,获得对应的语音强度信息;根据所述语音强度信息,确定所述第一目标拾音器的第一拾音参数。4.根据权利要求3所述的拾音控制方法,其特征在于,所述根据所述多个人声数据确定所述拾音器的第一拾音参数,还包括:当确定多个拾音器拾取到所述语音信息时,将所述目标声纹信息关联的拾音器确定为第一目标拾音器;对每个拾音器拾取到的所述多个人声数据进行分析,获得对应的语音强度信息;根据所述语音强度信息,确定所述第一目标拾音器的第一拾音参数。5.根据权利要求1所述的拾音控制方法,其特征在于,所述确定所述多个人声数据中是否包含所述拾音器关联的目标声纹信息之前,还包括:获取所述拾音器的配置信息;根据所述配置信息,确定所述拾音器是否已关联目标声纹信息;所述确定所述多个人声数据中是否包含所述拾音器关联的目标声纹信息,包括:当根据所述配置信息确定所述拾音器已关联目标声纹信息时,确定所述多个人声数据中是否包含所述拾音器关联的目标声纹信息。6.根据权利要求5所述的拾音控制方法,其特征在于,还包括:当确定所述多个人声数据中未包含所述拾音器关联的目标声纹信息时,将所述拾音器的拾音参数调整至第二拾音参数,所述第二拾音参数用于表征所述拾音器的语音拾取功能
被关闭。7.根据权利要求1至6任一项所述的拾音控制方法,其特征在于,还包括:当确定所述语音信息未包含多个人声数据时,确定是否多个拾音器拾取到所述语音信息;当确定多个拾音器拾取到所述语音信息时,根据每个拾音器拾取到的所述语音信息对应的单个人声数据,确定第二目标拾音器;将非第二目标拾音器的拾音参数调整至第三拾音参数,所述第三拾音参数用于表征所述非第二目标拾音器的语音拾取功能被关闭。8.根据权利要求7所述的拾音控制方法,其特征在于,所述当确定多个拾音器拾取到所述语音信息时,根据每个拾音器拾取到的所述语音信息对应的单个人声数据,确定第二目标拾音器,包括:当确定多个拾音器拾取到所述语音信息时,对每个拾音器拾取到的所述语音信息对应的单个人声数据进行分析,获得对应的语音强度信息和拾音距离,所述拾音距离用于表征所述拾音器拾取到人声数据的拾取距离;根据每个拾音器对应的所述语音强度信息和所述拾音距离,计算每个拾音器对应的单位能量参数,所述单位能量参数用于表征单位拾音距离的语音强度信息;将多个单位能量参数按照从大到小的顺序进行排序;获取所述单位能量参数最大的拾音器,并作为第二目标拾音器。9.一种拾音控制装置,其特征在于,包括:语音获取模块,用于获取拾音器拾取的语音信息;声纹确定模块,用于当确定所述语音信息包含多个人声数据时,确定所述多个人声数据中是否包含所述拾音器关联的目标声纹信息;调整模块,用于当确定所述多个人声数据中包含所述拾音器关联的目标声纹信息时调整所述拾音器的拾音参数,使得所述拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或所述拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,所述第一预设强度大于所述第二预设强度。10.一种电子设备,其特征在于,包括:存储器;一个或多个处理器,与所述存储器耦接;一个或多个应用程序,其中,所述一个或多个应用程序被存储在所述存储器中并被配置为由一个或多个处理器执行,所述一个或多个应用程序配置用于执行如权利要求1至8中任一项所述的拾音控制方法。11.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1至8中任一项所述的拾音控制方法。

技术总结
本申请公开了一种拾音控制方法、拾音控制装置、电子设备及存储介质,拾音控制方法包括获取拾音器拾取的语音信息;当确定语音信息包含多个人声数据时,确定多个人声数据中是否包含拾音器关联的目标声纹信息;当确定多个人声数据中包含拾音器关联的目标声纹信息时调整拾音器的拾音参数,使得拾音器拾取到目标声纹信息对应的目标人声数据的语音强度增强为第一预设强度,和/或拾音器拾取到非目标声纹信息对应的非目标人声数据的语音强度降低为第二预设强度,第一预设强度大于第二预设强度。本方法实现了根据拾音器拾取到的人声数据以及拾音器关联的目标声纹信息,调整拾音器的拾音参数,提高了拾音器的拾音效果。提高了拾音器的拾音效果。提高了拾音器的拾音效果。


技术研发人员:张伟彬 丁俊豪
受保护的技术使用者:深圳市声扬科技有限公司
技术研发日:2022.06.29
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-6900.html

最新回复(0)