音乐播放方法、装置、存储介质及电子设备与流程

专利2023-09-09 164

1.本发明涉及多媒体技术领域，特别是涉及一种音乐播放方法、装置、存储介质及电子设备。

背景技术：

2.在现场歌舞表演等应用场景中，表演现场存在音乐声、观众呐喊声、环境噪声等各种音频相互干扰，导致表演者单凭现场音乐，无法准确掌握表演节奏，从而出现过快或过慢等错位表演的情况。因此，除现场播放的音乐音频外，通常表演者还需要佩戴耳机，以便更清晰的接收音乐音频。
3.相关技术中，在对耳机中的音乐音频进行校对时，需要人工根据音乐的歌词和/或旋律，并结合相应的搜索软件来识别音乐曲目，确定音乐曲目后通过人工调节来实现当前耳机播放的音乐与环境中播放音乐的一致。而人工调节往往会使耳机中播放音乐与环境中播放音乐存在一定的偏差，无法做到耳机中的音乐音频与环境中的音乐音频同步播放，影响耳机用户的产品体验。

技术实现要素：

4.有鉴于此，本公开的目的在于提供一种音乐播放方法、装置、存储介质及电子设备，以解决相关技术中蓝牙耳机音乐与环境音乐无法同步播放的技术问题。
5.基于上述发明目的，本公开的第一方面提供一种音乐播放方法，应用于蓝牙耳机，所述方法包括：
6.在所述蓝牙耳机接收到的环境音频对应的音频分贝大于设定分贝阈值的情况下，基于神经网络模型对所述环境音频进行识别，判断所述环境音频是否存在第一音乐音频，在确定所述环境音频中存在所述第一音乐音频的情况下，对所述第一音乐音频进行识别，生成所述第一音乐音频对应的标识信息，并在所述音频分贝大于所述设定分贝阈值且所述环境音频中存在所述第一音乐音频时，重置并开启第一计时器，其中，所述第一音乐音频对应的目标音频分贝大于所述设定分贝阈值，所述标识信息中包括歌词数据和旋律数据；
7.根据所述标识信息从预设数据库中确定与所述第一音乐音频相同的目标音乐音频，确定所述目标音乐音频对应的目标歌词数据、目标旋律数据和时间戳，根据所述时间戳，将所述目标歌词数据与所述歌词数据进行比对，确定所述歌词数据在所述目标音乐音频中的第一时间节点，以及根据所述时间戳，将所述目标旋律数据与所述旋律数据进行比对，确定所述旋律数据在所述目标音乐音频中的第二时间节点，根据所述第一时间节点和所述第二时间节点确定所述目标音乐音频对应的目标时间节点；
8.读取所述第一计时器的当前计时数值，将所述当前计时数值与所述目标时间节点相加，生成同步时间节点，根据所述时间戳和所述同步时间节点，从所述目标音乐音频中确定起始播放位置，并根据所述起始播放位置，通过所述蓝牙耳机同步播放所述目标音乐音频；
9.通过所述蓝牙耳机采集预设时间段内环境中的第二音乐音频，从所述目标音乐音频中确定所述预设时间段内的第三音乐音频，将所述第二音乐音频和所述第三音乐音频进行比较，在确定所述第二音乐音频与所述第三音乐音频不同步的情况下，确定所述第二音乐音频与所述第三音乐音频之间的时间误差，根据所述时间误差对所述目标音乐音频进行调整，以使所述目标音乐音频与所述第一音乐音频同步。
10.进一步地，所述基于神经网络模型对所述环境音频进行识别，判断所述环境音频是否存在第一音乐音频，包括：
11.根据所述环境音频，在所述神经网络模型中建立卷积神经网络，所述卷积神经网络中包括依次对所述环境音频进行处理的输入层、卷积层、全连接层和输出层；
12.将所述环境音频输入到所述卷积神经网络的所述输入层，通过所述卷积层和所述全连接层对所述环境音频进行特征提取，以生成目标特征数据，并根据所述目标特征数据生成对应的特征向量，确定所述特征向量与预设特征向量的相似度，在所述相似度达到设定相似度阈值的情况下，确定所述环境音频中存在所述第一音乐音频，在所述相似度未达到所述设定相似度阈值的情况下，确定所述环境音频中不存在所述第一音乐音频。
13.进一步地，所述对所述第一音乐音频进行识别，生成所述第一音乐音频对应的标识信息，包括：
14.通过文字识别模型对所述第一音乐音频的歌词进行提取，以生成所述第一音乐音频对应的歌词数据；
15.通过旋律识别模型对所述第一音乐音频的旋律进行提取，以生成所述第一音乐音频对应的旋律数据；
16.根据所述歌词数据和所述旋律数据生成所述第一音乐音频对应的所述标识信息。
17.进一步地，所述根据所述标识信息从预设数据库中确定与所述第一音乐音频相同的目标音乐音频，包括：
18.从所述预设数据库中确定存在所述歌词数据的多个候选音乐音频；
19.确定所述多个候选音乐音频中所述歌词数据对应的多个候选旋律；
20.识别所述多个候选旋律对应的多个候选旋律线，以及所述旋律数据对应的目标旋律线；
21.将所述目标旋律线与所述多个候选旋律线进行对比，确定与所述目标旋律线对应的目标候选旋律线，以及所述目标候选旋律线对应的目标候选音乐音频；
22.确定所述目标候选音乐音频为所述目标音乐音频。
23.进一步地，所述根据所述第一时间节点和所述第二时间节点确定所述目标音乐音频对应的目标时间节点，包括：
24.根据所述第一时间节点，从所述目标音乐音频对应的所述时间戳中确定多个第一候选时间节点；
25.根据所述第二时间节点，从所述目标音乐音频对应的所述时间戳中确定多个第二候选时间节点；
26.将所述多个第一候选时间节点与多个第二候选时间节点进行比较，确定对应时间数值相同的时间节点为所述目标音乐音频对应的所述目标时间节点。
27.进一步地，所述将所述第二音乐音频和所述第三音乐音频进行比较，包括：
28.根据所述第二音乐音频生成对应的第一频谱曲线，以及根据所述第三音乐音频生成对应的第二频谱曲线；
29.将所述第一频谱曲线与所述第二频谱曲线进行比较，生成频谱误差范围；
30.在所述频谱误差范围小于预设误差范围的情况下，确定所述第二音乐音频与所述第三音乐音频同步；
31.在所述频谱误差范围大于等于所述预设误差范围的情况下，确定所述第二音乐音频与所述第三音乐音频不同步。
32.本公开的第二方面提供一种音乐播放装置，应用于蓝牙耳机，所述装置包括：
33.生成模块，用于在所述蓝牙耳机接收到的环境音频对应的音频分贝大于设定分贝阈值的情况下，基于神经网络模型对所述环境音频进行识别，判断所述环境音频是否存在第一音乐音频，在确定所述环境音频中存在所述第一音乐音频的情况下，对所述第一音乐音频进行识别，生成所述第一音乐音频对应的标识信息，并在所述音频分贝大于所述设定分贝阈值且所述环境音频中存在所述第一音乐音频时，重置并开启第一计时器，其中，所述第一音乐音频对应的目标音频分贝大于所述设定分贝阈值，所述标识信息中包括歌词数据和旋律数据；
34.确定模块，用于根据所述标识信息从预设数据库中确定与所述第一音乐音频相同的目标音乐音频，确定所述目标音乐音频对应的目标歌词数据、目标旋律数据和时间戳，根据所述时间戳，将所述目标歌词数据与所述歌词数据进行比对，确定所述歌词数据在所述目标音乐音频中的第一时间节点，以及根据所述时间戳，将所述目标旋律数据与所述旋律数据进行比对，确定所述旋律数据在所述目标音乐音频中的第二时间节点，根据所述第一时间节点和所述第二时间节点确定所述目标音乐音频对应的目标时间节点；
35.执行模块，用于读取所述第一计时器的当前计时数值，将所述当前计时数值与所述目标时间节点相加，生成同步时间节点，根据所述时间戳和所述同步时间节点，从所述目标音乐音频中确定起始播放位置，并根据所述起始播放位置，通过所述蓝牙耳机同步播放所述目标音乐音频；
36.调整模块，用于通过所述蓝牙耳机采集预设时间段内环境中的第二音乐音频，从所述目标音乐音频中确定所述预设时间段内的第三音乐音频，将所述第二音乐音频和所述第三音乐音频进行比较，在确定所述第二音乐音频与所述第三音乐音频不同步的情况下，确定所述第二音乐音频与所述第三音乐音频之间的时间误差，根据所述时间误差对所述目标音乐音频进行调整，以使所述目标音乐音频与所述第一音乐音频同步。
37.进一步地，所述生成模块，还可以用于：
38.根据所述环境音频，在所述神经网络模型中建立卷积神经网络，所述卷积神经网络中包括依次对所述环境音频进行处理的输入层、卷积层、全连接层和输出层；
39.将所述环境音频输入到所述卷积神经网络的所述输入层，通过所述卷积层和所述全连接层对所述环境音频进行特征提取，以生成目标特征数据，并根据所述目标特征数据生成对应的特征向量，确定所述特征向量与预设特征向量的相似度，在所述相似度达到设定相似度阈值的情况下，确定所述环境音频中存在所述第一音乐音频，在所述相似度未达到所述设定相似度阈值的情况下，确定所述环境音频中不存在所述第一音乐音频。
40.本公开的第三方面提供一种计算机存储介质，所述计算机存储介质上存储有计算
机程序，所述计算机程序被处理器运行时执行如第一方面中任一项所述方法的步骤。
41.本公开的第四方面提供一种电子设备，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现如第一方面中任一项所述方法的步骤。
42.本公开至少可以达到以下有益效果：
43.通过在环境音频对应的音频分贝大于设定分贝阈值的情况下，确定所述环境音频中的第一音乐音频，并重置和/或开启第一计时器，根据所述第一音乐音频对应的所述标识信息，确定目标音乐音频，根据所述目标音乐音频和所述第一音乐音频，从目标音乐音频的时间戳中确定目标时间节点，将所述当前计时数值与所述目标时间节点相加，生成同步时间节点，根据所述同步时间节点通过所述蓝牙耳机同步播放所述目标音乐音频，获取第二音乐音频和第三音乐音频，在确定所述第二音乐音频与所述第三音乐音频不同步的情况下，确定所述第二音乐音频与所述第三音乐音频之间的时间误差，根据所述时间误差对所述目标音乐音频进行调整。从而通过蓝牙耳机实现蓝牙耳机中音乐与环境中音乐的同步播放。
附图说明
44.图1为根据一示例性实施例示出的一种音乐播放方法的流程图。
45.图2是根据一示例性实施例示出的一种音乐播放装置的框图。
具体实施方式
46.为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似改进，因此本发明不受下面公开的具体实施例的限制。
47.在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。
48.此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。
49.在本发明中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。
50.在本发明中，除非另有明确的规定和限定，第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触，或第一和第二特征通过中间媒介间接接触。而且，第一特征在
第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方，或仅仅表示第一特征水平高度小于第二特征。
51.需要说明的是，当元件被称为“固定于”或“设置于”另一个元件，它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件，它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“上”、“下”、“左”、“右”以及类似的表述只是为了说明的目的，并不表示是唯一的实施方式。
52.图1为根据一示例性实施例示出的一种音乐播放方法的流程图，如图1所示，所述方法应用于蓝牙耳机，所述方法包括以下步骤：
53.在步骤s11中，在环境音频对应的音频分贝大于设定分贝阈值的情况下，确定所述环境音频中的第一音乐音频，并重置和/或开启第一计时器。
54.在步骤s12中，根据所述第一音乐音频对应的所述标识信息，确定目标音乐音频，根据所述目标音乐音频和所述第一音乐音频，从目标音乐音频的时间戳中确定目标时间节点。
55.在步骤s13中，将所述当前计时数值与所述目标时间节点相加，生成同步时间节点，根据所述同步时间节点通过所述蓝牙耳机同步播放所述目标音乐音频。
56.在步骤s14中，获取第二音乐音频和第三音乐音频，在确定所述第二音乐音频与所述第三音乐音频不同步的情况下，确定所述第二音乐音频与所述第三音乐音频之间的时间误差，根据所述时间误差对所述目标音乐音频进行调整。
57.通过上述方案，在环境音频对应的音频分贝大于设定分贝阈值的情况下，确定所述环境音频中的第一音乐音频，并重置和/或开启第一计时器，根据所述第一音乐音频对应的所述标识信息，确定目标音乐音频，根据所述目标音乐音频和所述第一音乐音频，从目标音乐音频的时间戳中确定目标时间节点，将所述当前计时数值与所述目标时间节点相加，生成同步时间节点，根据所述同步时间节点通过所述蓝牙耳机同步播放所述目标音乐音频，获取第二音乐音频和第三音乐音频，在确定所述第二音乐音频与所述第三音乐音频不同步的情况下，确定所述第二音乐音频与所述第三音乐音频之间的时间误差，根据所述时间误差对所述目标音乐音频进行调整。从而通过蓝牙耳机实现蓝牙耳机中音乐与环境中音乐的同步播放。
58.进一步地，上述步骤s11，包括：
59.根据所述环境音频，在所述神经网络模型中建立卷积神经网络，所述卷积神经网络中包括依次对所述环境音频进行处理的输入层、卷积层、全连接层和输出层；
60.将所述环境音频输入到所述卷积神经网络的所述输入层，通过所述卷积层和所述全连接层对所述环境音频进行特征提取，以生成目标特征数据，并根据所述目标特征数据生成对应的特征向量，确定所述特征向量与预设特征向量的相似度，在所述相似度达到设定相似度阈值的情况下，确定所述环境音频中存在所述第一音乐音频，在所述相似度未达到所述设定相似度阈值的情况下，确定所述环境音频中不存在所述第一音乐音频。
61.进一步地，上述步骤s11，包括：
62.通过文字识别模型对所述第一音乐音频的歌词进行提取，以生成所述第一音乐音
频对应的歌词数据；
63.通过旋律识别模型对所述第一音乐音频的旋律进行提取，以生成所述第一音乐音频对应的旋律数据；
64.根据所述歌词数据和所述旋律数据生成所述第一音乐音频对应的所述标识信息。
65.进一步地，上述步骤s12，包括：
66.从所述预设数据库中确定存在所述歌词数据的多个候选音乐音频；
67.确定所述多个候选音乐音频中所述歌词数据对应的多个候选旋律；
68.识别所述多个候选旋律对应的多个候选旋律线，以及所述旋律数据对应的目标旋律线；
69.将所述目标旋律线与所述多个候选旋律线进行对比，确定与所述目标旋律线对应的目标候选旋律线，以及所述目标候选旋律线对应的目标候选音乐音频；
70.确定所述目标候选音乐音频为所述目标音乐音频。
71.进一步地，上述步骤s12，包括：
72.根据所述第一时间节点，从所述目标音乐音频对应的所述时间戳中确定多个第一候选时间节点；
73.根据所述第二时间节点，从所述目标音乐音频对应的所述时间戳中确定多个第二候选时间节点；
74.将所述多个第一候选时间节点与多个第二候选时间节点进行比较，确定对应时间数值相同的时间节点为所述目标音乐音频对应的所述目标时间节点。
75.进一步地，上述步骤s14，包括：
76.根据所述第二音乐音频生成对应的第一频谱曲线，以及根据所述第三音乐音频生成对应的第二频谱曲线；
77.将所述第一频谱曲线与所述第二频谱曲线进行比较，生成频谱误差范围；
78.在所述频谱误差范围小于预设误差范围的情况下，确定所述第二音乐音频与所述第三音乐音频同步；
79.在所述频谱误差范围大于等于所述预设误差范围的情况下，确定所述第二音乐音频与所述第三音乐音频不同步。
80.通过上述方案，在环境音频对应的音频分贝大于设定分贝阈值的情况下，确定所述环境音频中的第一音乐音频，并重置和/或开启第一计时器，根据所述第一音乐音频对应的所述标识信息，确定目标音乐音频，根据所述目标音乐音频和所述第一音乐音频，从目标音乐音频的时间戳中确定目标时间节点，将所述当前计时数值与所述目标时间节点相加，生成同步时间节点，根据所述同步时间节点通过所述蓝牙耳机同步播放所述目标音乐音频，获取第二音乐音频和第三音乐音频，在确定所述第二音乐音频与所述第三音乐音频不同步的情况下，确定所述第二音乐音频与所述第三音乐音频之间的时间误差，根据所述时间误差对所述目标音乐音频进行调整。从而通过蓝牙耳机实现蓝牙耳机中音乐与环境中音乐的同步播放。
81.图2是根据一示例性实施例示出的一种音乐播放装置的结构图，所述装置100应用于蓝牙耳机，装置100包括：生成模块110，确定模块120，执行模块130和调整模块140。
82.生成模块，用于在所述蓝牙耳机接收到的环境音频对应的音频分贝大于设定分贝
阈值的情况下，基于神经网络模型对所述环境音频进行识别，判断所述环境音频是否存在第一音乐音频，在确定所述环境音频中存在所述第一音乐音频的情况下，对所述第一音乐音频进行识别，生成所述第一音乐音频对应的标识信息，并在所述音频分贝大于所述设定分贝阈值且所述环境音频中存在所述第一音乐音频时，重置并开启第一计时器，其中，所述第一音乐音频对应的目标音频分贝大于所述设定分贝阈值，所述标识信息中包括歌词数据和旋律数据；
83.确定模块，用于根据所述标识信息从预设数据库中确定与所述第一音乐音频相同的目标音乐音频，确定所述目标音乐音频对应的目标歌词数据、目标旋律数据和时间戳，根据所述时间戳，将所述目标歌词数据与所述歌词数据进行比对，确定所述歌词数据在所述目标音乐音频中的第一时间节点，以及根据所述时间戳，将所述目标旋律数据与所述旋律数据进行比对，确定所述旋律数据在所述目标音乐音频中的第二时间节点，根据所述第一时间节点和所述第二时间节点确定所述目标音乐音频对应的目标时间节点；
84.执行模块，用于读取所述第一计时器的当前计时数值，将所述当前计时数值与所述目标时间节点相加，生成同步时间节点，根据所述时间戳和所述同步时间节点，从所述目标音乐音频中确定起始播放位置，并根据所述起始播放位置，通过所述蓝牙耳机同步播放所述目标音乐音频；
85.调整模块，用于通过所述蓝牙耳机采集预设时间段内环境中的第二音乐音频，从所述目标音乐音频中确定所述预设时间段内的第三音乐音频，将所述第二音乐音频和所述第三音乐音频进行比较，在确定所述第二音乐音频与所述第三音乐音频不同步的情况下，确定所述第二音乐音频与所述第三音乐音频之间的时间误差，根据所述时间误差对所述目标音乐音频进行调整，以使所述目标音乐音频与所述第一音乐音频同步。
86.通过上述装置，在环境音频对应的音频分贝大于设定分贝阈值的情况下，确定所述环境音频中的第一音乐音频，并重置和/或开启第一计时器，根据所述第一音乐音频对应的所述标识信息，确定目标音乐音频，根据所述目标音乐音频和所述第一音乐音频，从目标音乐音频的时间戳中确定目标时间节点，将所述当前计时数值与所述目标时间节点相加，生成同步时间节点，根据所述同步时间节点通过所述蓝牙耳机同步播放所述目标音乐音频，获取第二音乐音频和第三音乐音频，在确定所述第二音乐音频与所述第三音乐音频不同步的情况下，确定所述第二音乐音频与所述第三音乐音频之间的时间误差，根据所述时间误差对所述目标音乐音频进行调整。从而通过蓝牙耳机实现蓝牙耳机中音乐与环境中音乐的同步播放。
87.进一步地，所述生成模块110，还可以用于：
88.根据所述环境音频，在所述神经网络模型中建立卷积神经网络，所述卷积神经网络中包括依次对所述环境音频进行处理的输入层、卷积层、全连接层和输出层；
89.将所述环境音频输入到所述卷积神经网络的所述输入层，通过所述卷积层和所述全连接层对所述环境音频进行特征提取，以生成目标特征数据，并根据所述目标特征数据生成对应的特征向量，确定所述特征向量与预设特征向量的相似度，在所述相似度达到设定相似度阈值的情况下，确定所述环境音频中存在所述第一音乐音频，在所述相似度未达到所述设定相似度阈值的情况下，确定所述环境音频中不存在所述第一音乐音频。
90.进一步地，所述生成模块110，还可以用于：
91.通过文字识别模型对所述第一音乐音频的歌词进行提取，以生成所述第一音乐音频对应的歌词数据；
92.通过旋律识别模型对所述第一音乐音频的旋律进行提取，以生成所述第一音乐音频对应的旋律数据；
93.根据所述歌词数据和所述旋律数据生成所述第一音乐音频对应的所述标识信息。
94.进一步地，所述确定模块120，还可以用于：
95.从所述预设数据库中确定存在所述歌词数据的多个候选音乐音频；
96.确定所述多个候选音乐音频中所述歌词数据对应的多个候选旋律；
97.识别所述多个候选旋律对应的多个候选旋律线，以及所述旋律数据对应的目标旋律线；
98.将所述目标旋律线与所述多个候选旋律线进行对比，确定与所述目标旋律线对应的目标候选旋律线，以及所述目标候选旋律线对应的目标候选音乐音频；
99.确定所述目标候选音乐音频为所述目标音乐音频。
100.进一步地，所述确定模块120，还可以用于：
101.根据所述第一时间节点，从所述目标音乐音频对应的所述时间戳中确定多个第一候选时间节点；
102.根据所述第二时间节点，从所述目标音乐音频对应的所述时间戳中确定多个第二候选时间节点；
103.将所述多个第一候选时间节点与多个第二候选时间节点进行比较，确定对应时间数值相同的时间节点为所述目标音乐音频对应的所述目标时间节点。
104.进一步地，所述调整模块140，还可以用于：
105.根据所述第二音乐音频生成对应的第一频谱曲线，以及根据所述第三音乐音频生成对应的第二频谱曲线；
106.将所述第一频谱曲线与所述第二频谱曲线进行比较，生成频谱误差范围；
107.在所述频谱误差范围小于预设误差范围的情况下，确定所述第二音乐音频与所述第三音乐音频同步；
108.在所述频谱误差范围大于等于所述预设误差范围的情况下，确定所述第二音乐音频与所述第三音乐音频不同步。
109.基于同一发明构思，本公开实施例提供一种计算机存储介质，所述计算机存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行上述任一项所述音乐播放方法的步骤。
110.基于同一发明构思，本公开实施例提供一种电子设备，包括计算机程序，该计算机程序被处理器执行时实现上述任一项所述音乐播放方法的步骤。
111.以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
112.以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护
范围。因此，本发明专利的保护范围应以所附权利要求为准。

技术特征：
1.一种音乐播放方法，其特征在于，应用于蓝牙耳机，所述方法包括：在所述蓝牙耳机接收到的环境音频对应的音频分贝大于设定分贝阈值的情况下，基于神经网络模型对所述环境音频进行识别，判断所述环境音频是否存在第一音乐音频，在确定所述环境音频中存在所述第一音乐音频的情况下，对所述第一音乐音频进行识别，生成所述第一音乐音频对应的标识信息，并在所述音频分贝大于所述设定分贝阈值且所述环境音频中存在所述第一音乐音频时，重置并开启第一计时器，其中，所述第一音乐音频对应的目标音频分贝大于所述设定分贝阈值，所述标识信息中包括歌词数据和旋律数据；根据所述标识信息从预设数据库中确定与所述第一音乐音频相同的目标音乐音频，确定所述目标音乐音频对应的目标歌词数据、目标旋律数据和时间戳，根据所述时间戳，将所述目标歌词数据与所述歌词数据进行比对，确定所述歌词数据在所述目标音乐音频中的第一时间节点，以及根据所述时间戳，将所述目标旋律数据与所述旋律数据进行比对，确定所述旋律数据在所述目标音乐音频中的第二时间节点，根据所述第一时间节点和所述第二时间节点确定所述目标音乐音频对应的目标时间节点；读取所述第一计时器的当前计时数值，将所述当前计时数值与所述目标时间节点相加，生成同步时间节点，根据所述时间戳和所述同步时间节点，从所述目标音乐音频中确定起始播放位置，并根据所述起始播放位置，通过所述蓝牙耳机同步播放所述目标音乐音频；通过所述蓝牙耳机采集预设时间段内环境中的第二音乐音频，从所述目标音乐音频中确定所述预设时间段内的第三音乐音频，将所述第二音乐音频和所述第三音乐音频进行比较，在确定所述第二音乐音频与所述第三音乐音频不同步的情况下，确定所述第二音乐音频与所述第三音乐音频之间的时间误差，根据所述时间误差对所述目标音乐音频进行调整，以使所述目标音乐音频与所述第一音乐音频同步。2.根据权利要求1所述的方法，其特征在于，所述基于神经网络模型对所述环境音频进行识别，判断所述环境音频是否存在第一音乐音频，包括：根据所述环境音频，在所述神经网络模型中建立卷积神经网络，所述卷积神经网络中包括依次对所述环境音频进行处理的输入层、卷积层、全连接层和输出层；将所述环境音频输入到所述卷积神经网络的所述输入层，通过所述卷积层和所述全连接层对所述环境音频进行特征提取，以生成目标特征数据，并根据所述目标特征数据生成对应的特征向量，确定所述特征向量与预设特征向量的相似度，在所述相似度达到设定相似度阈值的情况下，确定所述环境音频中存在所述第一音乐音频，在所述相似度未达到所述设定相似度阈值的情况下，确定所述环境音频中不存在所述第一音乐音频。3.根据权利要求1所述的方法，其特征在于，所述对所述第一音乐音频进行识别，生成所述第一音乐音频对应的标识信息，包括：通过文字识别模型对所述第一音乐音频的歌词进行提取，以生成所述第一音乐音频对应的歌词数据；通过旋律识别模型对所述第一音乐音频的旋律进行提取，以生成所述第一音乐音频对应的旋律数据；根据所述歌词数据和所述旋律数据生成所述第一音乐音频对应的所述标识信息。4.根据权利要求3所述的方法，其特征在于，所述根据所述标识信息从预设数据库中确定与所述第一音乐音频相同的目标音乐音频，包括：
从所述预设数据库中确定存在所述歌词数据的多个候选音乐音频；确定所述多个候选音乐音频中所述歌词数据对应的多个候选旋律；识别所述多个候选旋律对应的多个候选旋律线，以及所述旋律数据对应的目标旋律线；将所述目标旋律线与所述多个候选旋律线进行对比，确定与所述目标旋律线对应的目标候选旋律线，以及所述目标候选旋律线对应的目标候选音乐音频；确定所述目标候选音乐音频为所述目标音乐音频。5.根据权利要求1所述的方法，其特征在于，所述根据所述第一时间节点和所述第二时间节点确定所述目标音乐音频对应的目标时间节点，包括：根据所述第一时间节点，从所述目标音乐音频对应的所述时间戳中确定多个第一候选时间节点；根据所述第二时间节点，从所述目标音乐音频对应的所述时间戳中确定多个第二候选时间节点；将所述多个第一候选时间节点与多个第二候选时间节点进行比较，确定对应时间数值相同的时间节点为所述目标音乐音频对应的所述目标时间节点。6.根据权利要求1所述的方法，其特征在于，所述将所述第二音乐音频和所述第三音乐音频进行比较，包括：根据所述第二音乐音频生成对应的第一频谱曲线，以及根据所述第三音乐音频生成对应的第二频谱曲线；将所述第一频谱曲线与所述第二频谱曲线进行比较，生成频谱误差范围；在所述频谱误差范围小于预设误差范围的情况下，确定所述第二音乐音频与所述第三音乐音频同步；在所述频谱误差范围大于等于所述预设误差范围的情况下，确定所述第二音乐音频与所述第三音乐音频不同步。7.一种音乐播放装置，其特征在于，应用于蓝牙耳机，所述装置包括：生成模块，用于在所述蓝牙耳机接收到的环境音频对应的音频分贝大于设定分贝阈值的情况下，基于神经网络模型对所述环境音频进行识别，判断所述环境音频是否存在第一音乐音频，在确定所述环境音频中存在所述第一音乐音频的情况下，对所述第一音乐音频进行识别，生成所述第一音乐音频对应的标识信息，并在所述音频分贝大于所述设定分贝阈值且所述环境音频中存在所述第一音乐音频时，重置并开启第一计时器，其中，所述第一音乐音频对应的目标音频分贝大于所述设定分贝阈值，所述标识信息中包括歌词数据和旋律数据；确定模块，用于根据所述标识信息从预设数据库中确定与所述第一音乐音频相同的目标音乐音频，确定所述目标音乐音频对应的目标歌词数据、目标旋律数据和时间戳，根据所述时间戳，将所述目标歌词数据与所述歌词数据进行比对，确定所述歌词数据在所述目标音乐音频中的第一时间节点，以及根据所述时间戳，将所述目标旋律数据与所述旋律数据进行比对，确定所述旋律数据在所述目标音乐音频中的第二时间节点，根据所述第一时间节点和所述第二时间节点确定所述目标音乐音频对应的目标时间节点；执行模块，用于读取所述第一计时器的当前计时数值，将所述当前计时数值与所述目
标时间节点相加，生成同步时间节点，根据所述时间戳和所述同步时间节点，从所述目标音乐音频中确定起始播放位置，并根据所述起始播放位置，通过所述蓝牙耳机同步播放所述目标音乐音频；调整模块，用于通过所述蓝牙耳机采集预设时间段内环境中的第二音乐音频，从所述目标音乐音频中确定所述预设时间段内的第三音乐音频，将所述第二音乐音频和所述第三音乐音频进行比较，在确定所述第二音乐音频与所述第三音乐音频不同步的情况下，确定所述第二音乐音频与所述第三音乐音频之间的时间误差，根据所述时间误差对所述目标音乐音频进行调整，以使所述目标音乐音频与所述第一音乐音频同步。8.根据权利要求7所述的装置，其特征在于，所述生成模块用于：根据所述环境音频，在所述神经网络模型中建立卷积神经网络，所述卷积神经网络中包括依次对所述环境音频进行处理的输入层、卷积层、全连接层和输出层；将所述环境音频输入到所述卷积神经网络的所述输入层，通过所述卷积层和所述全连接层对所述环境音频进行特征提取，以生成目标特征数据，并根据所述目标特征数据生成对应的特征向量，确定所述特征向量与预设特征向量的相似度，在所述相似度达到设定相似度阈值的情况下，确定所述环境音频中存在所述第一音乐音频，在所述相似度未达到所述设定相似度阈值的情况下，确定所述环境音频中不存在所述第一音乐音频。9.一种计算机存储介质，其特征在于，所述计算机存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1-6任一项所述方法的步骤。10.一种电子设备，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-6所述方法的步骤。

技术总结
本公开提供一种音乐播放方法、装置、存储介质及电子设备，该方法包括：若环境音频对应的音频分贝大于设定分贝阈值，则确定环境音频中的第一音乐音频，并开启第一计时器，根据第一音乐音频对应的标识信息，确定目标音乐音频，根据目标音乐音频和第一音乐音频，从目标音乐音频的时间戳中确定目标时间节点，将当前计时数值与目标时间节点相加，生成同步时间节点，根据同步时间节点通过蓝牙耳机同步播放目标音乐音频，获取第二音乐音频和第三音乐音频，在确定第二音乐音频与第三音乐音频不同步的情况下，确定第二音乐音频与第三音乐音频之间的时间误差，根据时间误差对目标音乐音频进行调整。从而通过蓝牙耳机实现蓝牙耳机中音乐与环境中音乐的同步播放。与环境中音乐的同步播放。与环境中音乐的同步播放。

技术研发人员：曾子娟
受保护的技术使用者：格声智能科技（深圳）有限公司
技术研发日：2022.07.19
技术公布日：2022/11/1

转载请注明原文地址: https://tieba.8miu.com/read-5026.html

专利

最新回复(0)